Angry_Panda - 博客园

强化学习中经典算法 —— reinforce算法 —— （进一步理解，理论推导出的计算模型和实际应用中的计算模型的区别）

摘要：在奖励折扣率为1的情况下，既没有折扣的情况下，reinforce算法理论上可以写为：但是在有折扣的情况下，reinforce算法理论上可以写为：以上均为理论模型。根据上面的理论上的算法模型，或者说是伪代码，你是难以使用这个算法的。这个reinforce算法也是十分古怪和气人的，之所以这样说是因阅读全文

posted @ 2020-12-24 22:35 Angry_Panda 阅读(3621) 评论(1) 推荐(0)

【转载】 Linux 设置CPU Performance模式

posted @ 2020-12-24 08:30 Angry_Panda 阅读(5693) 评论(0) 推荐(0)

深度学习中使用TensorFlow或Pytorch框架时到底是应该使用CPU还是GPU来进行运算？？？

摘要：本文实验环境为Python3.7， TensorFlow-gpu=1.14, CPU为i7-9700k，锁频4.9Ghz, GPU为2060super显卡机器学习按照不同的分类标准可以有不同的分类方式，这里我们将深度学习按照感知学习和决策控制学习可以分为两类。感知学习类的比较有名的就是图像识别，语阅读全文

posted @ 2020-12-20 23:10 Angry_Panda 阅读(3016) 评论(1) 推荐(0)

【转载】 nohup和&区别

摘要：原文地址： https://www.cnblogs.com/xinzaiyuan/p/12097919.html & ：指在后台运行 nohup ：不挂断的运行，注意并没有后台运行的功能。就是指，用nohup运行命令可以使命令永久的执行下去，和用户终端没有关系，例如我们断开SSH连接都不会影响阅读全文

posted @ 2020-12-09 11:47 Angry_Panda 阅读(1570) 评论(1) 推荐(0)

Ubuntu18.04环境下安装网络代理软件 proxychains

摘要：安装：网络代理软件proxychains安装： sudo apt-get install proxychains 为保证使用 proxychains 时 sudo proxychains 时可以实现dns代理，需安装 dnsutils ： sudo apt-get install dnsutils 阅读全文

posted @ 2020-12-08 18:07 Angry_Panda 阅读(1658) 评论(0) 推荐(0)

基于浅层神经网络（全连接网络）的强化学习算法（Reinforce）在训练过程中出现梯度衰退（degenerate）的现象

摘要：首先给出一个代码地址： https://gitee.com/devilmaycry812839668/CartPole-PolicyNetwork 强化学习中的策略网络算法。《TensorFlow实战》一书中强化学习部分的策略网络算法，仿真环境为gym的CartPole，本项目是对原书代码进行了部分阅读全文

posted @ 2020-12-07 15:22 Angry_Panda 阅读(512) 评论(1) 推荐(0)

【转载】训练深度神经网络失败的罪魁祸首不是梯度消失，而是退化

摘要：原文地址： https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650735824&idx=1&sn=1720a687f197538b23d8d329e87998fb&chksm=871ac0aeb06d49b826d8f7d6370e2fc 阅读全文

posted @ 2020-12-07 00:04 Angry_Panda 阅读(427) 评论(0) 推荐(0)

【转载】 CNN训练Cifar-10技巧

摘要：原文地址： https://www.cnblogs.com/neopenx/p/4480701.html 关于数据集 Cifar-10是由Hinton的两个大弟子Alex Krizhevsky、Ilya Sutskever收集的一个用于普适物体识别的数据集。Cifar是加拿大政府牵头投资的一个先进科阅读全文

posted @ 2020-12-06 20:08 Angry_Panda 阅读(772) 评论(0) 推荐(0)

【转载】 ReLu(Rectified Linear Units)激活函数

摘要：原文地址： https://www.cnblogs.com/neopenx/p/4453161.html 论文参考：Deep Sparse Rectifier Neural Networks (很有趣的一篇paper）起源：传统激活函数、脑神经元激活频率研究、稀疏激活性传统Sigmoid系激活函阅读全文

posted @ 2020-12-06 18:10 Angry_Panda 阅读(401) 评论(1) 推荐(0)

强化学习中经验池的替代设计——A3C算法

摘要：读论文《Asynchronous methods for deep reinforcement learning》有感阅读全文

posted @ 2020-11-27 19:47 Angry_Panda 阅读(590) 评论(3) 推荐(0)

Angry Panda（T-800）

公告

导航