2020年7月27日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:2007.08794v1 [cs.LG] 17 Jul 2020 Abstract RL算法根据经过多年研究手动发现的几种可能规则之一来更新智能体的参数。从数据中自动发现更新规则可能会导致效率更高的算法,或者更适合特定环境的算 阅读全文
posted @ 2020-07-27 20:11 穷酸秀才大草包 阅读(659) 评论(0) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 1 DeepMind, London, UK2 University College London, London, UK3 Princeton University, Princeton, NJ, USA*Correspondence: 阅读全文
posted @ 2020-07-27 11:31 穷酸秀才大草包 阅读(677) 评论(0) 推荐(0)

导航