勒勒乐了

摘要：方法很多，这里我说一下使用 docker-connector解决这个问题这是一个github开源项目docker-connector 1. Mac 通过 brew 安装 docker-connector brew install wenjunxiao/b... 阅读全文

posted @ 2021-08-19 12:55 勒勒乐了阅读(1081) 评论(0) 推荐(0)

摘要：使用的vscode写代码，导入了vector，memory，然后忘了导入string。但是代码中能够提示std::string也就让我忘了导入string。然后就莫名其妙的报错了。找了很久的错。记录下 std::string& StrBlobPtr::dein... 阅读全文

posted @ 2021-07-06 11:59 勒勒乐了阅读(1248) 评论(0) 推荐(0)

摘要：在用户主目录下有一个 .bashrc 隐藏文件，可以在此文件中加入 PATH 的设置如下： gedit ~/.bashrc 加入： export PATH=:$PATH 如果要加入多个路径，只要： export PATH=:: ...... :$PATH 当中... 阅读全文

posted @ 2020-09-12 11:41 勒勒乐了阅读(270) 评论(0) 推荐(0)

摘要：什么是分层强化学习解决稀疏奖励问题通常有两种思路：对动作进行分层，将low-level动作组成high-level元动作，这样搜索... 阅读全文

posted @ 2020-09-09 20:56 勒勒乐了阅读(279) 评论(0) 推荐(0)

摘要：元学习是深度学习领域最活跃的研究领域之一。人工智能（AI）社区中的一些思想流派赞成这样的论点，即元学习是解锁人工智能（AGI）的垫脚石之一。近年来，我们已经看到了元学习技术的研究与开发中的爆炸式增长。但是，元学习背后的一些基本思想仍然被数据科学家和工程师误解。... 阅读全文

posted @ 2019-12-14 11:41 勒勒乐了阅读(141) 评论(0) 推荐(0)

摘要：本篇文章利用tensorflow2.0自定义loss函数实现policy gradient策略梯度，自定义loss=-log(prob) *Vt现在训练最高分能到193分，但是还是不稳定，在修改中，欢迎一起探讨文章代码也有参考莫烦大佬的代码action_dim... 阅读全文

posted @ 2019-12-10 10:56 勒勒乐了阅读(188) 评论(0) 推荐(0)

让自己每天都有事情