Angry_Panda - 博客园

Learning from delayed reward (Q-Learning的提出) （Watkins博士毕业论文）（建立了现在的reinforcement Learning模型）

摘要：最近在在学习强化学习方面的东西，对于现有的很多文章中关于强化学习的知识很是不理解，很多都是一个公式套一个公式，也没有什么太多的解释，感觉像是在看天书一般，经过了较长时间的挣扎最后决定从一些基础的东西开始入手，于是便有了这篇论文的发现。 Learning from Delayed Reward 该论阅读全文

posted @ 2019-01-11 20:47 Angry_Panda 阅读(5464) 评论(0) 推荐(0)

ubuntu18.04 server配置静态ip (转载)

摘要：原文地址: https://blog.csdn.net/mossan/article/details/80381679 最新发布的ubuntu18.04 server，启用了新的网络工具netplan，对于命令行配置网络参数跟之前的版本有比较大的差别，现在介绍如下：1.其网络配置文件是放在/etc/ 阅读全文

posted @ 2019-01-11 14:27 Angry_Panda 阅读(1367) 评论(0) 推荐(0)

强化学习 reinforcement learning： An Introduction 第一章， tic-and-toc 代码示例（结构重建版，注释版）

摘要：强化学习入门最经典的数据估计就是那个大名鼎鼎的 reinforcement learning: An Introduction 了，最近在看这本书，第一章中给出了一个例子用来说明什么是强化学习，那就是tic-and-toc游戏，感觉这个名很不Chinese，感觉要是用中文来说应该叫三子棋啥的才形阅读全文

posted @ 2019-01-10 10:02 Angry_Panda 阅读(1299) 评论(0) 推荐(0)

杨强：深度学习、强化学习、迁移学习的结合及应用进展（转载）

摘要：原文地址： https://blog.csdn.net/happytofly/article/details/80124513 作为首位美国人工智能协会（AAAI）华人Fellow，唯一AAAI华人Councilor，国际顶级学术会议KDD、IJCAI等大会主席，香港科技大学计算机与工程系主任杨强教阅读全文

posted @ 2019-01-08 11:28 Angry_Panda 阅读(3048) 评论(0) 推荐(0)

做强化学习，怎么往下走，个人思考

摘要：阅读全文

posted @ 2019-01-08 10:52 Angry_Panda 阅读(220) 评论(1) 推荐(0)

[python]自问自答：python -m参数？（ python3.7 版本）

摘要：最近在看Python代码的时候看到了一种形式，即 python -m 这种形式，查了一些博客，发现了一篇写的还不错，转载了过来，不过那里面写的是Python2.7的环境和python3还是有些区别的，下面给出Python2.7形式的如下： https://www.cnblogs.com/devi 阅读全文

posted @ 2019-01-07 21:42 Angry_Panda 阅读(2390) 评论(1) 推荐(0)

常用增强学习实验环境 II (ViZDoom, Roboschool, TensorFlow Agents, ELF, Coach等) （转载）

摘要：原文链接：http://blog.csdn.net/jinzhuojun/article/details/78508203 前段时间Nature上发表的升级版Alpha Go - AlphaGo Zero再一次成为热点话题。作为其核心技术之一的Deep reinforcement learning（阅读全文

posted @ 2019-01-07 14:38 Angry_Panda 阅读(1368) 评论(0) 推荐(0)

常用增强学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2) (转载)

摘要：原文地址：http://blog.csdn.net/jinzhuojun/article/details/77144590 和其它的机器学习方向一样，强化学习（Reinforcement Learning）也有一些经典的实验场景，像Mountain-Car，Cart-Pole等。话说很久以前，因为没阅读全文

posted @ 2019-01-07 14:28 Angry_Panda 阅读(2944) 评论(0) 推荐(0)

[python]自问自答：python -m参数？（转）（ python2.7 版本）

摘要：原文地址： http://www.cnblogs.com/xueweihan/p/5118222.html python -m xxx.py 作用是：把xxx.py文件当做模块启动但是我一直不明白当做模块启动到底有什么用。python xxx.py和python -m xxx.py有什么区别！自阅读全文

posted @ 2019-01-06 21:34 Angry_Panda 阅读(580) 评论(0) 推荐(0)

强化学习常用平台

摘要：本篇博客主要是讲一下强化学习的一些常用平台，强化学习的发展已经好多年了，以前都是大家做什么实验然后都是自己编写环境代码，由于很多人的代码都是不公开的所以其他人要继续做前人的工作就需要自己重新构建环境代码，这样做一方面做了很多重复工作，浪费了大量的时间，而且很没有必要，另一方面每个人都重新编写各自的阅读全文

posted @ 2019-01-06 15:04 Angry_Panda 阅读(3764) 评论(0) 推荐(1)

Angry Panda（T-800）

公告

导航