摘要: 动态规划算法学习笔记 阅读全文
posted @ 2023-05-17 21:35 lee_ing 阅读(53) 评论(0) 推荐(0)
摘要: 优先级经验回放改进---改进优先级更新公式【专注于具有更高的可减少TD误差的样本,而不是根据TD误差进行优先级排序】 阅读全文
posted @ 2023-05-17 16:32 lee_ing 阅读(228) 评论(3) 推荐(1)
摘要: 将回放缓冲区(或内存)划分为多个簇,每个簇代表与作为示例的经验集合相关的不同解释,从而修改了传统的经验回放结构。 阅读全文
posted @ 2023-05-17 11:37 lee_ing 阅读(36) 评论(0) 推荐(0)