摘要: 方法很多,这里我说一下使用 docker-connector解决这个问题 这是一个github开源项目docker-connector 1. Mac 通过 brew 安装 docker-connector brew install wenjunxiao/b... 阅读全文
posted @ 2021-08-19 12:55 勒勒乐了 阅读(1081) 评论(0) 推荐(0)
摘要: 使用的vscode写代码,导入了vector,memory,然后忘了导入string。但是代码中能够提示std::string也就让我忘了导入string。然后就莫名其妙的报错了。找了很久的错。记录下 std::string& StrBlobPtr::dein... 阅读全文
posted @ 2021-07-06 11:59 勒勒乐了 阅读(1248) 评论(0) 推荐(0)
摘要: 在用户主目录下有一个 .bashrc 隐藏文件,可以在此文件中加入 PATH 的设置如下: gedit ~/.bashrc 加入: export PATH=:$PATH 如果要加入多个路径,只要: export PATH=:: ...... :$PATH 当中... 阅读全文
posted @ 2020-09-12 11:41 勒勒乐了 阅读(270) 评论(0) 推荐(0)
摘要: 什么是分层强化学习 解决稀疏奖励问题通常有两种思路:对动作进行分层,将low-level动作组成high-level元动作,这样搜索... 阅读全文
posted @ 2020-09-09 20:56 勒勒乐了 阅读(279) 评论(0) 推荐(0)
摘要: 元学习是深度学习领域最活跃的研究领域之一。人工智能(AI)社区中的一些思想流派赞成这样的论点,即元学习是解锁人工智能(AGI)的垫脚石之一。近年来,我们已经看到了元学习技术的研究与开发中的爆炸式增长。但是,元学习背后的一些基本思想仍然被数据科学家和工程师误解。... 阅读全文
posted @ 2019-12-14 11:41 勒勒乐了 阅读(141) 评论(0) 推荐(0)
摘要: 本篇文章利用tensorflow2.0自定义loss函数实现policy gradient策略梯度,自定义loss=-log(prob) *Vt现在训练最高分能到193分,但是还是不稳定,在修改中,欢迎一起探讨文章代码也有参考莫烦大佬的代码action_dim... 阅读全文
posted @ 2019-12-10 10:56 勒勒乐了 阅读(188) 评论(0) 推荐(0)