2023 年 3月 14 日随笔档案 - 阿Qi早起了吗

2023年3月14日

摘要： Deep Q-Learning 产生和更新Q表在大状态空间环境中可能变得无效 Deep Q-Learning使用了一个神经网络，它获取一个状态，并基于该状态近似每个动作的Q-值，而不是使用Q-表。我们将使用RL Zoo训练它玩太空入侵者和其他雅达利环境，这是一个使用稳定基线的RL训练框架，提供训练脚阅读全文

posted @ 2023-03-14 09:37 阿Qi早起了吗阅读(169) 评论(0) 推荐(0)

公告