2022 年 6月 29 日随笔档案 - 穷酸秀才大草包

2022年6月29日

Offline Reinforcement Learning as One Big Sequence Modeling Problem

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ NeurIPS 2021 代码可以从此处获取 Abstract 强化学习(RL)通常与估计静态策略或单步模型有关，利用马尔可夫属性及时分解问题。然而，我们也可以将RL视为一个通用的序列建模问题，其目标是产生一系列动作，从而导致一系列高回报阅读全文

posted @ 2022-06-29 20:09 穷酸秀才大草包阅读(518) 评论(0) 推荐(0)

穷酸秀才大艹包

导航

公告