papers - 随笔分类(第2页) - lee_ing

摘要：针对AC算法不能有效的使用PER，证明actor不能使用PER更好的训练，提出改进，使用一个全新的优先级结构tree，并与critic共享部分训练集，结合LAP的结论，使得AC+PER效果更优阅读全文

posted @ 2023-05-16 12:07 lee_ing 阅读(148) 评论(0) 推荐(0)

摘要：事件表分层抽样(SSET)，将ER缓冲区划分为事件表，每个事件表捕获最优行为的重要子序列。阅读全文

posted @ 2023-05-10 11:43 lee_ing 阅读(37) 评论(0) 推荐(0)

摘要：利用时序卷积+注意力机制弥补RNN的不足阅读全文

posted @ 2022-05-09 12:00 lee_ing 阅读(223) 评论(0) 推荐(0)

摘要：利用循环神经网络来进行先验知识的学习，进而优化RL model 阅读全文

posted @ 2022-05-08 16:27 lee_ing 阅读(232) 评论(0) 推荐(0)

摘要：利用第一次梯度对第二次梯度进行提升。阅读全文

posted @ 2022-05-08 12:16 lee_ing 阅读(77) 评论(0) 推荐(0)

摘要：元学习系统（监督+从属）扩展于RL设置阅读全文

posted @ 2022-05-07 19:30 lee_ing 阅读(98) 评论(0) 推荐(0)

摘要：利用梯度下降进行元学习阅读全文

posted @ 2022-05-07 17:05 lee_ing 阅读(62) 评论(0) 推荐(0)

Lee_ing