摘要:
强化学习 一、强化学习定义 1.强化学习就是程序或智能体(agent)通过与环境不断地进行交互学习一个从环境到动作的映射,学习的目标就是使累计回报最大化。 2.强化学习是一种试错学习,因其在各种状态(环境)下需要尽量尝试所有可以选择的动作,通过环境给出的反馈(即奖励)来判断动作的优劣,最终获得环境和 阅读全文
posted @ 2020-02-06 02:05
白包子
阅读(533)
评论(0)
推荐(0)
2020年2月6日