上一页 1 ··· 245 246 247 248 249 250 251 252 253 ··· 272 下一页

2019年1月11日

摘要: 最近在在学习强化学习方面的东西, 对于现有的很多文章中关于强化学习的知识很是不理解,很多都是一个公式套一个公式,也没有什么太多的解释,感觉像是在看天书一般,经过了较长时间的挣扎最后决定从一些基础的东西开始入手,于是便有了这篇论文的发现。 Learning from Delayed Reward 该论 阅读全文
posted @ 2019-01-11 20:47 Angry_Panda 阅读(5464) 评论(0) 推荐(0)
摘要: 原文地址: https://blog.csdn.net/mossan/article/details/80381679 最新发布的ubuntu18.04 server,启用了新的网络工具netplan,对于命令行配置网络参数跟之前的版本有比较大的差别,现在介绍如下:1.其网络配置文件是放在/etc/ 阅读全文
posted @ 2019-01-11 14:27 Angry_Panda 阅读(1367) 评论(0) 推荐(0)

2019年1月10日

摘要: 强化学习入门最经典的数据估计就是那个大名鼎鼎的 reinforcement learning: An Introduction 了, 最近在看这本书,第一章中给出了一个例子用来说明什么是强化学习,那就是tic-and-toc游戏, 感觉这个名很不Chinese,感觉要是用中文来说应该叫三子棋啥的才形 阅读全文
posted @ 2019-01-10 10:02 Angry_Panda 阅读(1299) 评论(0) 推荐(0)

2019年1月8日

摘要: 原文地址: https://blog.csdn.net/happytofly/article/details/80124513 作为首位美国人工智能协会(AAAI)华人Fellow,唯一AAAI华人Councilor,国际顶级学术会议KDD、IJCAI等大会主席,香港科技大学计算机与工程系主任杨强教 阅读全文
posted @ 2019-01-08 11:28 Angry_Panda 阅读(3048) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2019-01-08 10:52 Angry_Panda 阅读(220) 评论(1) 推荐(0)

2019年1月7日

摘要: 最近在看Python代码的时候看到了一种形式, 即 python -m 这种形式, 查了一些博客,发现了一篇写的还不错,转载了过来,不过那里面写的是Python2.7的环境和python3还是有些区别的,下面给出Python2.7形式的如下: https://www.cnblogs.com/devi 阅读全文
posted @ 2019-01-07 21:42 Angry_Panda 阅读(2390) 评论(1) 推荐(0)
摘要: 原文链接:http://blog.csdn.net/jinzhuojun/article/details/78508203 前段时间Nature上发表的升级版Alpha Go - AlphaGo Zero再一次成为热点话题。作为其核心技术之一的Deep reinforcement learning( 阅读全文
posted @ 2019-01-07 14:38 Angry_Panda 阅读(1368) 评论(0) 推荐(0)
摘要: 原文地址:http://blog.csdn.net/jinzhuojun/article/details/77144590 和其它的机器学习方向一样,强化学习(Reinforcement Learning)也有一些经典的实验场景,像Mountain-Car,Cart-Pole等。话说很久以前,因为没 阅读全文
posted @ 2019-01-07 14:28 Angry_Panda 阅读(2944) 评论(0) 推荐(0)

2019年1月6日

摘要: 原文地址: http://www.cnblogs.com/xueweihan/p/5118222.html python -m xxx.py 作用是:把xxx.py文件当做模块启动 但是我一直不明白当做模块启动到底有什么用。python xxx.py和python -m xxx.py有什么区别! 自 阅读全文
posted @ 2019-01-06 21:34 Angry_Panda 阅读(580) 评论(0) 推荐(0)
摘要: 本篇博客主要是讲一下强化学习的一些常用平台, 强化学习的发展已经好多年了,以前都是大家做什么实验然后都是自己编写环境代码,由于很多人的代码都是不公开的所以其他人要继续做前人的工作就需要自己重新构建环境代码,这样做一方面做了很多重复工作,浪费了大量的时间,而且很没有必要,另一方面每个人都重新编写各自的 阅读全文
posted @ 2019-01-06 15:04 Angry_Panda 阅读(3764) 评论(0) 推荐(1)
上一页 1 ··· 245 246 247 248 249 250 251 252 253 ··· 272 下一页

导航