摘要: 1 Q-Learning 强化学习中有state和action的两个重要概念。而Q-Learning算法就是用来得到在state上执行action的未来预期奖励。具体的算法流程如下: 初始化一个Q-table。 在当前状态\(s\)选择一个动作\(a\)。 执行动作\(a\),转移到新的状态\(s' 阅读全文
posted @ 2023-10-20 00:02 SheepHuan 阅读(50) 评论(0) 推荐(0) 编辑