摘要: Sparse Reward 推荐资料 《深度强化学习中稀疏奖励问题研究综述》1 李宏毅深度强化学习Sparse Reward4 ​ 强化学习算法在被引入深度神经网络后,对大量样本的需求更加明显。如果智能体在与环境的交互过程中没有获得奖励,那么该样本在基于值函数和基于策略梯度的损失中的贡献会很小。 ​ 阅读全文
posted @ 2021-08-03 23:06 Dawn嗯 阅读(2321) 评论(0) 推荐(0)