上一页 1 ··· 215 216 217 218 219 220 221 222 223 ··· 271 下一页

2021年1月22日

摘要: 本文代码地址: https://gitee.com/devilmaycry812839668/final_-version_-parallelism_-reinforce_-cart-pole 结合了前面几个版本的并行化强化学习的设计,给出了最终版本。gym下简单的CarlPole环境作为仿真环境, 阅读全文
posted @ 2021-01-22 20:57 Angry_Panda 阅读(480) 评论(0) 推荐(0)

2021年1月16日

摘要: 本文代码地址: https://gitee.com/devilmaycry812839668/parallelism_-multi_-step_-reinforce_-cart-pole 和前文: 并行化强化学习 —— 初探 —— 并行reinforce算法的尝试 (中篇:强化学习在大规模仿真环境下 阅读全文
posted @ 2021-01-16 10:49 Angry_Panda 阅读(247) 评论(0) 推荐(0)

2021年1月6日

摘要: 序言:读书的研究方向为强化学习,做学术自然开始着手做的事情就是阅读论文,不过读着读者相关的论文就发现了一些问题,强化学习方向的论文大部分都是上来给出一种在以往算法上的改进,给出具体改进算法的伪代码,然后说下简单的理解判断用来说明一下为什么这个改进的算法有效,但是这往往导致这些所谓的解释难以真正的对其 阅读全文
posted @ 2021-01-06 08:38 Angry_Panda 阅读(1145) 评论(2) 推荐(0)

2021年1月4日

摘要: 本篇博客是前篇博客并行化强化学习 —— 初探 —— 并行reinforce算法的尝试 (上篇:强化学习在多仿真环境下单步交互并行化设计的可行性)的继续,文中代码地址为:https://gitee.com/devilmaycry812839668/Parallelism_Reinforce_CartP 阅读全文
posted @ 2021-01-04 16:58 Angry_Panda 阅读(286) 评论(0) 推荐(0)

2021年1月2日

摘要: 强化学习由于难收敛所以训练周期较长,同时由于强化学习在训练过程中起训练数据一般都为实时生成的,因此在训练的同时算法还需要生成待训练的数据,强化学习算法的基本架构可以视作下图:(取自:深度学习中使用TensorFlow或Pytorch框架时到底是应该使用CPU还是GPU来进行运算???) 由强化学习的 阅读全文
posted @ 2021-01-02 09:24 Angry_Panda 阅读(1123) 评论(0) 推荐(0)

2021年1月1日

摘要: 本博文是一篇狂想曲,之所以叫狂想曲是因为本文只是博主在无聊时突发奇想,而且仅停留于想的阶段,所以本文内容不用太过认真。 事情是这样的,博主有一台式机,有事没事的就喜欢宅在宿舍里面,有时候还能偶然用这台式机写写代码跑跑程序啥的。由于该电脑需要跑跑代码,而一运行负荷较大的算法就会要CPU甚至GPU蛮负荷 阅读全文
posted @ 2021-01-01 11:01 Angry_Panda 阅读(1608) 评论(1) 推荐(0)

2020年12月31日

摘要: 参考: https://www.cnblogs.com/iwetuan/p/13567810.html 实验室有一台无人使用的老式服务器放在角落里落灰,由于网络设备的历史原因导致该服务器不能联网,为了能继续使用该服务器(毕竟没人抢着用)于是欲使用网络代理使该服务器可以联网,也就是说在同一网段下的其他 阅读全文
posted @ 2020-12-31 12:21 Angry_Panda 阅读(4015) 评论(0) 推荐(0)

2020年12月29日

摘要: 本文相关的博客:(预先知识) 强化学习中经典算法 —— reinforce算法 —— (进一步理解, 理论推导出的计算模型和实际应用中的计算模型的区别) 本文代码地址: https://gitee.com/devilmaycry812839668/cart-pole_-policy-network_ 阅读全文
posted @ 2020-12-29 23:15 Angry_Panda 阅读(1851) 评论(2) 推荐(0)

2020年12月28日

摘要: 如题,现有需求,为一个server版本的Ubuntu18.04配置 IP 。 在网上查到了 Ubuntu18.04 桌面版本 的配置方法: https://www.cnblogs.com/sammei/p/ubuntu-dan-wang-ka-shuang-ip.html $ cat /etc/ne 阅读全文
posted @ 2020-12-28 16:09 Angry_Panda 阅读(1277) 评论(0) 推荐(0)
摘要: 前些年写过这个登录程序,过了几年系统有所升级,于是做了一定的修改。 新版本的校园网登录程序依然是模拟浏览器去登录校园网。 Python3.7编写。 #encoding:UTF-8 from urllib.parse import urlencode from urllib.request impor 阅读全文
posted @ 2020-12-28 15:42 Angry_Panda 阅读(293) 评论(1) 推荐(0)
上一页 1 ··· 215 216 217 218 219 220 221 222 223 ··· 271 下一页

导航