摘要: 针对AC算法不能有效的使用PER,证明actor不能使用PER更好的训练,提出改进,使用一个全新的优先级结构tree,并与critic共享部分训练集,结合LAP的结论,使得AC+PER效果更优 阅读全文
posted @ 2023-05-16 12:07 lee_ing 阅读(152) 评论(0) 推荐(0)