会员
周边
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
王振耀
博客园
首页
新随笔
联系
订阅
管理
2019年1月12日
基于C#的机器学习--惩罚与奖励-强化学习
摘要: 强化学习概况 正如在前面所提到的,强化学习是指一种计算机以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使程序获得最大的奖赏,强化学习不同于连督学习,区别主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统如
阅读全文
posted @ 2019-01-12 15:23 王振耀
阅读(6356)
评论(13)
推荐(31)
编辑
公告