上一页 1 ··· 207 208 209 210 211 212 213 214 215 ··· 263 下一页

2021年1月4日

摘要: 本篇博客是前篇博客并行化强化学习 —— 初探 —— 并行reinforce算法的尝试 (上篇:强化学习在多仿真环境下单步交互并行化设计的可行性)的继续,文中代码地址为:https://gitee.com/devilmaycry812839668/Parallelism_Reinforce_CartP 阅读全文
posted @ 2021-01-04 16:58 Angry_Panda 阅读(267) 评论(0) 推荐(0)

2021年1月2日

摘要: 强化学习由于难收敛所以训练周期较长,同时由于强化学习在训练过程中起训练数据一般都为实时生成的,因此在训练的同时算法还需要生成待训练的数据,强化学习算法的基本架构可以视作下图:(取自:深度学习中使用TensorFlow或Pytorch框架时到底是应该使用CPU还是GPU来进行运算???) 由强化学习的 阅读全文
posted @ 2021-01-02 09:24 Angry_Panda 阅读(1098) 评论(0) 推荐(0)

2021年1月1日

摘要: 本博文是一篇狂想曲,之所以叫狂想曲是因为本文只是博主在无聊时突发奇想,而且仅停留于想的阶段,所以本文内容不用太过认真。 事情是这样的,博主有一台式机,有事没事的就喜欢宅在宿舍里面,有时候还能偶然用这台式机写写代码跑跑程序啥的。由于该电脑需要跑跑代码,而一运行负荷较大的算法就会要CPU甚至GPU蛮负荷 阅读全文
posted @ 2021-01-01 11:01 Angry_Panda 阅读(1586) 评论(1) 推荐(0)

2020年12月31日

摘要: 参考: https://www.cnblogs.com/iwetuan/p/13567810.html 实验室有一台无人使用的老式服务器放在角落里落灰,由于网络设备的历史原因导致该服务器不能联网,为了能继续使用该服务器(毕竟没人抢着用)于是欲使用网络代理使该服务器可以联网,也就是说在同一网段下的其他 阅读全文
posted @ 2020-12-31 12:21 Angry_Panda 阅读(3975) 评论(0) 推荐(0)

2020年12月29日

摘要: 本文相关的博客:(预先知识) 强化学习中经典算法 —— reinforce算法 —— (进一步理解, 理论推导出的计算模型和实际应用中的计算模型的区别) 本文代码地址: https://gitee.com/devilmaycry812839668/cart-pole_-policy-network_ 阅读全文
posted @ 2020-12-29 23:15 Angry_Panda 阅读(1824) 评论(2) 推荐(0)

2020年12月28日

摘要: 如题,现有需求,为一个server版本的Ubuntu18.04配置 IP 。 在网上查到了 Ubuntu18.04 桌面版本 的配置方法: https://www.cnblogs.com/sammei/p/ubuntu-dan-wang-ka-shuang-ip.html $ cat /etc/ne 阅读全文
posted @ 2020-12-28 16:09 Angry_Panda 阅读(1265) 评论(0) 推荐(0)
摘要: 前些年写过这个登录程序,过了几年系统有所升级,于是做了一定的修改。 新版本的校园网登录程序依然是模拟浏览器去登录校园网。 Python3.7编写。 #encoding:UTF-8 from urllib.parse import urlencode from urllib.request impor 阅读全文
posted @ 2020-12-28 15:42 Angry_Panda 阅读(282) 评论(1) 推荐(0)

2020年12月24日

摘要: 在奖励折扣率为1的情况下,既没有折扣的情况下,reinforce算法理论上可以写为: 但是在有折扣的情况下,reinforce算法理论上可以写为: 以上均为理论模型。 根据上面的理论上的算法模型,或者说是伪代码,你是难以使用这个算法的。这个reinforce算法也是十分古怪和气人的,之所以这样说是因 阅读全文
posted @ 2020-12-24 22:35 Angry_Panda 阅读(3590) 评论(1) 推荐(0)
摘要: 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/zaf0516/article/details/95769589 在Linux中,内核的开发者定义了一套框架模型来完成CPU频率动态调整这一 阅读全文
posted @ 2020-12-24 08:30 Angry_Panda 阅读(5619) 评论(0) 推荐(0)

2020年12月20日

摘要: 本文实验环境为Python3.7, TensorFlow-gpu=1.14, CPU为i7-9700k,锁频4.9Ghz, GPU为2060super显卡 机器学习按照不同的分类标准可以有不同的分类方式,这里我们将深度学习按照感知学习和决策控制学习可以分为两类。感知学习类的比较有名的就是图像识别,语 阅读全文
posted @ 2020-12-20 23:10 Angry_Panda 阅读(2985) 评论(1) 推荐(0)
上一页 1 ··· 207 208 209 210 211 212 213 214 215 ··· 263 下一页

导航