2020年9月7日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! CoRR, (2019) Abstract 通常,从有限的一组选项中试探性地选择损失函数,正则化机制和训练参数模型的其他重要方面。在本文中,我们将朝着使该过程自动化的第一步迈进,以期产生能够更快且更强大的训练模型。具体而言,我们提出了一种 阅读全文
posted @ 2020-09-07 15:27 穷酸秀才大草包 阅读(827) 评论(0) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! NeurIPS, (2018) Abstract 我们提出了一种元学习方法,用于学习基于梯度的RL算法。这个想法是要逐步形成一种可微的损失函数,这样智能体就可以通过优化其策略以最大程度地减少这种损失,获得较高的奖励。损失是通过智能体经验的 阅读全文
posted @ 2020-09-07 14:54 穷酸秀才大草包 阅读(425) 评论(0) 推荐(0)

导航