2025 年 2月 25 日随笔档案 - 霜尘FrostDust

2025年2月25日

摘要：本文主要是对论文Decision Transformer: Reinforcement Learning via Sequence Modeling的复现记录由于论文年代比较早(21年)，主要的复现工作也是在22年之前，随着环境和包依赖的改变，实现起来比较困难。笔者作为RL小白也是在配置环境上面吃阅读全文

posted @ 2025-02-25 23:08 霜尘FrostDust 阅读(452) 评论(0) 推荐(0)

FrostDust

公告