摘要: 本文主要是对论文Decision Transformer: Reinforcement Learning via Sequence Modeling的复现记录 由于论文年代比较早(21年),主要的复现工作也是在22年之前,随着环境和包依赖的改变,实现起来比较困难。笔者作为RL小白也是在配置环境上面吃 阅读全文
posted @ 2025-02-25 23:08 霜尘FrostDust 阅读(452) 评论(0) 推荐(0)