会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
从流域到海域
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
8
···
31
下一页
2019年11月23日
Monte Carlo Tree Search (MCTS) 蒙特·卡罗尔树搜索
摘要: Monte Carlo Tree Search 为什么要学习MCTS一部分原因是过去12年AI最大的成就莫过于Alpha Go,一个...
阅读全文
posted @ 2019-11-23 21:56 从流域到海域
阅读(168)
评论(0)
推荐(0)
2019年11月19日
Imitation Learning in Large State Spaces 大规模状态空间下的模仿学习
摘要: 这篇博文中的Imitation learning关注于和强化学习的结合,但imitation learning自身其实是一个独立...
阅读全文
posted @ 2019-11-19 21:33 从流域到海域
阅读(154)
评论(0)
推荐(0)
2019年11月16日
Deep Q learning: DQN及其改进
摘要: Deep Q Learning Generalization Deep Reinforcement Learning 使用深度神经...
阅读全文
posted @ 2019-11-16 17:20 从流域到海域
阅读(283)
评论(0)
推荐(0)
2019年11月9日
CNNs and Deep Q Learning
摘要: 前面的一篇博文介绍了函数价值近似,是以简单的线性函数来做的,这篇博文介绍使用深度神经网络来做函数近似,也就是Deep RL。这篇...
阅读全文
posted @ 2019-11-09 18:32 从流域到海域
阅读(101)
评论(0)
推荐(0)
2019年11月4日
Planning and Learning
摘要: 这算是一篇综述性文章,讲的不深,但是可以了解做planning都有哪些方法。这篇文章里全部使用了Q的说法,因为实现上可能是网络D...
阅读全文
posted @ 2019-11-04 15:04 从流域到海域
阅读(64)
评论(0)
推荐(0)
2019年10月28日
Value function approximation
摘要: 前面的一篇博客:Model-free control:如何从经验中学习一个好的策略 到目前为止,我们都假设了可以将价值函数或stat...
阅读全文
posted @ 2019-10-28 20:59 从流域到海域
阅读(120)
评论(0)
推荐(0)
2019年10月26日
从SARSA算法到Q-learning with ϵ-greedy Exploration算法
摘要: 这篇博文是Model-Free Control的一部分,事实上SARSA和Q-learning with ϵ-greedy Ex...
阅读全文
posted @ 2019-10-26 22:23 从流域到海域
阅读(202)
评论(0)
推荐(0)
2019年10月25日
ϵ-greedy Policies
摘要: ϵ \epsilon ...
阅读全文
posted @ 2019-10-25 22:37 从流域到海域
阅读(602)
评论(0)
推荐(0)
2019年10月23日
Model-Free Control
摘要: Control(making decisions) without a model of how the world works...
阅读全文
posted @ 2019-10-23 22:16 从流域到海域
阅读(162)
评论(0)
推荐(0)
2019年10月22日
Importance Sampling 重要性采样
摘要: Importance Sampling(重要性采样),也是常用估计函数价值在某个概率分布下的期望的一个方法。这篇博文先简要介绍I...
阅读全文
posted @ 2019-10-22 21:57 从流域到海域
阅读(277)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
···
31
下一页
公告