随笔分类 -  强化学习

摘要:#基本定义 ##时序决策 在人工智能领域,时序决策是考虑了世界是动态变化的算法,可以认为是一种循序渐进的决策理论,较早的决策会影响较晚的可用选择。例如我们考虑一个推箱子到指定区域的问题,从初始状态(start state)到目标状态(goal state)的一系列动作(action)都会影响到达目标 阅读全文
posted @ 2020-08-08 22:09 线性流逝 阅读(578) 评论(0) 推荐(0)