2023 年 10月 20 日随笔档案 - SheepHuan

2023年10月20日

摘要： 1 Q-Learning 强化学习中有state和action的两个重要概念。而Q-Learning算法就是用来得到在state上执行action的未来预期奖励。具体的算法流程如下：初始化一个Q-table。在当前状态\(s\)选择一个动作\(a\)。执行动作\(a\)，转移到新的状态\(s' 阅读全文

posted @ 2023-10-20 00:02 SheepHuan 阅读(397) 评论(0) 推荐(0)

SheepHuan的博客

公告