会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Blueherb
In solitude, where we are least alone
帅气的小土豆
博客园
首页
新随笔
联系
订阅
管理
2021年2月10日
寒假自学2.10
摘要: Q-Learning算法 Q-learning要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。 强化学习目的是构造一个控制策略,使得Agent行为性能达到最大。Agent从复杂的环境中感知信息,对信息进行处理。Agent通过学习改进自身的性能并选择行为,
阅读全文
posted @ 2021-02-10 19:14 帅气的小土豆
阅读(32)
评论(0)
推荐(0)
公告