2022 年 6月 27 日随笔档案 - 穷酸秀才大草包

2022年6月27日

Conservative Q-Learning for Offline Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ NeurIPS 2020 Abstract 在强化学习(RL)中有效利用以前收集的大型数据集是大规模现实世界应用程序的关键挑战。离线RL算法承诺从先前收集的静态数据集中学习有效的策略，而无需进一步交互。然而，在实践中，离线RL提出了一个重阅读全文

posted @ 2022-06-27 20:01 穷酸秀才大草包阅读(1147) 评论(0) 推荐(0)

穷酸秀才大艹包

导航

公告