2020年7月15日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1902.08102v1 [stat.ML] 21 Feb 2019 Abstract 我们通过递归估计回报分布的统计量,提供了一个统一的框架,用于设计和分析分布强化学习(DRL)算法。我们的主要见识在于,可以将DRL算法分解 阅读全文
posted @ 2020-07-15 09:53 穷酸秀才大草包 阅读(578) 评论(0) 推荐(0)

导航