上一页 1 ··· 216 217 218 219 220 221 222 223 224 ··· 271 下一页

2020年12月24日

摘要: 在奖励折扣率为1的情况下,既没有折扣的情况下,reinforce算法理论上可以写为: 但是在有折扣的情况下,reinforce算法理论上可以写为: 以上均为理论模型。 根据上面的理论上的算法模型,或者说是伪代码,你是难以使用这个算法的。这个reinforce算法也是十分古怪和气人的,之所以这样说是因 阅读全文
posted @ 2020-12-24 22:35 Angry_Panda 阅读(3621) 评论(1) 推荐(0)
摘要: 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/zaf0516/article/details/95769589 在Linux中,内核的开发者定义了一套框架模型来完成CPU频率动态调整这一 阅读全文
posted @ 2020-12-24 08:30 Angry_Panda 阅读(5693) 评论(0) 推荐(0)

2020年12月20日

摘要: 本文实验环境为Python3.7, TensorFlow-gpu=1.14, CPU为i7-9700k,锁频4.9Ghz, GPU为2060super显卡 机器学习按照不同的分类标准可以有不同的分类方式,这里我们将深度学习按照感知学习和决策控制学习可以分为两类。感知学习类的比较有名的就是图像识别,语 阅读全文
posted @ 2020-12-20 23:10 Angry_Panda 阅读(3016) 评论(1) 推荐(0)

2020年12月9日

摘要: 原文地址: https://www.cnblogs.com/xinzaiyuan/p/12097919.html & : 指在后台运行 nohup : 不挂断的运行,注意并没有后台运行的功能。 就是指,用nohup运行命令可以使命令永久的执行下去,和用户终端没有关系,例如我们断开SSH连接都不会影响 阅读全文
posted @ 2020-12-09 11:47 Angry_Panda 阅读(1570) 评论(1) 推荐(0)

2020年12月8日

摘要: 安装: 网络代理软件proxychains安装: sudo apt-get install proxychains 为保证使用 proxychains 时 sudo proxychains 时可以实现dns代理,需安装 dnsutils : sudo apt-get install dnsutils 阅读全文
posted @ 2020-12-08 18:07 Angry_Panda 阅读(1658) 评论(0) 推荐(0)

2020年12月7日

摘要: 首先给出一个代码地址: https://gitee.com/devilmaycry812839668/CartPole-PolicyNetwork 强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法,仿真环境为gym的CartPole,本项目是对原书代码进行了部分 阅读全文
posted @ 2020-12-07 15:22 Angry_Panda 阅读(512) 评论(1) 推荐(0)
摘要: 原文地址: https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650735824&idx=1&sn=1720a687f197538b23d8d329e87998fb&chksm=871ac0aeb06d49b826d8f7d6370e2fc 阅读全文
posted @ 2020-12-07 00:04 Angry_Panda 阅读(427) 评论(0) 推荐(0)

2020年12月6日

摘要: 原文地址: https://www.cnblogs.com/neopenx/p/4480701.html 关于数据集 Cifar-10是由Hinton的两个大弟子Alex Krizhevsky、Ilya Sutskever收集的一个用于普适物体识别的数据集。Cifar是加拿大政府牵头投资的一个先进科 阅读全文
posted @ 2020-12-06 20:08 Angry_Panda 阅读(772) 评论(0) 推荐(0)
摘要: 原文地址: https://www.cnblogs.com/neopenx/p/4453161.html 论文参考:Deep Sparse Rectifier Neural Networks (很有趣的一篇paper) 起源:传统激活函数、脑神经元激活频率研究、稀疏激活性 传统Sigmoid系激活函 阅读全文
posted @ 2020-12-06 18:10 Angry_Panda 阅读(401) 评论(1) 推荐(0)

2020年11月27日

摘要: 读论文《Asynchronous methods for deep reinforcement learning》有感 阅读全文
posted @ 2020-11-27 19:47 Angry_Panda 阅读(590) 评论(3) 推荐(0)
上一页 1 ··· 216 217 218 219 220 221 222 223 224 ··· 271 下一页

导航