2023年10月1日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Published as a conference paper at ICLR 2023 ABSTRACT 在具有连续动作空间的异策深度强化学习中,探索通常通过在动作选择过程中注入动作噪声来实现。基于随机策略的流行算法,如SAC或MPO, 阅读全文
posted @ 2023-10-01 10:58 穷酸秀才大草包 阅读(473) 评论(0) 推荐(0)

导航