会员
众包
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
LincHpin
首页
联系
订阅
管理
2019年3月17日
Policy Gradients
摘要: 这篇博客只是为了自己记录,思路比较跳跃。 Policy Gradients 不估计局面的价值,转而预测选取每个动作的概率。因为某些游戏中我们可能会需要在相同的状态下做出随机行为,比如说某些资源有限的游戏,我们不可能一直在某一个地方一直获取资源。 更新函数是$\theta_{t+1}=\theta_t
阅读全文
posted @ 2019-03-17 00:33 LincHpin
阅读(136)
评论(0)
推荐(0)
编辑
2016年12月18日
Machine Learning Notes Ⅵ
摘要: 朴素贝叶斯与神经网络
阅读全文
posted @ 2016-12-18 20:26 LincHpin
阅读(127)
评论(0)
推荐(0)
编辑
2016年12月4日
Machine Learning Notes Ⅴ
摘要: 生成学习算法与贝叶斯平滑
阅读全文
posted @ 2016-12-04 21:07 LincHpin
阅读(175)
评论(0)
推荐(0)
编辑
Machine Learning Notes Ⅳ
摘要: 牛顿方法与广义线性模型
阅读全文
posted @ 2016-12-04 20:51 LincHpin
阅读(184)
评论(0)
推荐(0)
编辑
2016年12月3日
Machine Learning Notes Ⅲ
摘要: 局部加权回归与Logistic回归
阅读全文
posted @ 2016-12-03 21:28 LincHpin
阅读(186)
评论(0)
推荐(0)
编辑
Machine Learning Notes Ⅱ
摘要: 监督学习的应用:梯度下降
阅读全文
posted @ 2016-12-03 21:19 LincHpin
阅读(120)
评论(0)
推荐(0)
编辑
2016年12月2日
Machine Learning Notes Ⅰ
摘要: 机器学习的动机与应用
阅读全文
posted @ 2016-12-02 19:41 LincHpin
阅读(112)
评论(0)
推荐(0)
编辑
公告