2020年11月2日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Arxiv:https://arxiv.org/abs/1812.05905 Abstract 无模型的深度RL算法已成功应用于一系列具有挑战性的序列决策和控制任务。但是,这些方法通常面临两个主要挑战:高样本复杂性和超参数的脆弱性。这两个 阅读全文
posted @ 2020-11-02 19:07 穷酸秀才大草包 阅读(858) 评论(0) 推荐(0)

导航