会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
罗兵の水库
人生苦短,我用Python
博客园
首页
新随笔
联系
管理
上一页
1
2
3
4
5
6
···
29
下一页
2018年12月20日
【强化学习】python 实现 saras lambda 例一
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10147265.html 将例一用saras lambda算法重新撸了一遍,没有参照任何其他人的代码。仅仅根据伪代码,就撸出来了。感觉已真正理解了saras lambda算法。记录如下 0. s
阅读全文
posted @ 2018-12-20 02:24 罗兵
阅读(875)
评论(0)
推荐(0)
2018年12月19日
【强化学习】python 实现 saras 例一
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10146554.html 说明:将之前 q-learning 实现的例一,用 saras 重新写了一遍。具体问题这里就不多说了。 0. q-learning 与 saras 伪代码的对比 图片来
阅读全文
posted @ 2018-12-19 22:21 罗兵
阅读(1637)
评论(0)
推荐(0)
【强化学习】python 实现 q-learning 迷宫通用模板
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10145797.html 0.说明 这里提供了二维迷宫问题的一个比较通用的模板,拿到后需要修改的地方非常少。 对于任意的二维迷宫的 class Agent,只需修改三个地方:MAZE_R, MA
阅读全文
posted @ 2018-12-19 20:31 罗兵
阅读(4610)
评论(4)
推荐(2)
【强化学习】python 实现 q-learning 例五(GUI)
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10143579.html 感谢pengdali,本文的 class Maze 参考了他的博客,地址:https://blog.csdn.net/pengdali/article/details/
阅读全文
posted @ 2018-12-19 15:29 罗兵
阅读(4530)
评论(0)
推荐(0)
2018年12月18日
【强化学习】python 实现 q-learning 例四(例二改写)
摘要: 将例二改写成面向对象模式,并加了环境! 不过更新环境的过程中,用到了清屏命令,play()的时候,会有点问题。learn()的时候可以勉强看到:P 0.效果图 1.完整代码 相对于例一,修改的地方: Agent 五处:states, actions, rewards, get_valid_actio
阅读全文
posted @ 2018-12-18 21:35 罗兵
阅读(1395)
评论(0)
推荐(0)
【强化学习】python 实现 q-learning 例三(例一改写)
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10139738.html 例一的代码是函数式编写的,这里用面向对象的方式重新撸了一遍。好处是,更便于理解环境(Env)、个体(Agent)之间的关系。 有缘看到的朋友,自己慢慢体会吧。 0.效果
阅读全文
posted @ 2018-12-18 20:17 罗兵
阅读(2156)
评论(0)
推荐(0)
【强化学习】python 实现 q-learning 例二
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10134855.html 问题情境 一个2*2的迷宫,一个入口,一个出口,还有一个陷阱。如图 (图片来源:https://jizhi.im/blog/post/intro_q_learning)
阅读全文
posted @ 2018-12-18 00:43 罗兵
阅读(6649)
评论(0)
推荐(0)
2018年12月17日
【强化学习】python 实现 q-learning 例一
摘要: 本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10134018.html 问题情境 -o T# T 就是宝藏的位置, o 是探索者的位置 这一次我们会用 q-learning 的方法实现一个小例子,例子的环境是一个一维世界,在世界的右边有宝藏
阅读全文
posted @ 2018-12-17 21:23 罗兵
阅读(16230)
评论(3)
推荐(0)
2018年12月13日
python棋类游戏编写入门
摘要: 刚接触棋类游戏程序编写的朋友,往往比较迷惑,不知从何下手。 本文总结了棋类游戏的主程序流程、计算机走子策略、打分方式(以井字棋、黑白棋、五子棋为例),未使用minimax算法,比较简单,适合刚接触的朋友。特记录如下: 作者:hhh5460 本文地址:https://www.cnblogs.com/h
阅读全文
posted @ 2018-12-13 15:22 罗兵
阅读(2399)
评论(0)
推荐(0)
2018年12月2日
推荐几个表格工具
摘要: 今天,发现了几个好用的在线表格,特做记录如下: 本文地址:https://www.cnblogs.com/hhh5460/p/10052392.html 1、Treation 网址:https://treation.com/ (说明:此表前端使用vue.js) 效果图: 2、Ethercalc 网址
阅读全文
posted @ 2018-12-02 10:35 罗兵
阅读(1057)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
29
下一页
公告