随笔档案「2020年9月7日」：Meta Learning via Learned Loss ... - 穷酸秀才大草包

2020年9月7日

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ CoRR, (2019) Abstract 通常，从有限的一组选项中试探性地选择损失函数，正则化机制和训练参数模型的其他重要方面。在本文中，我们将朝着使该过程自动化的第一步迈进，以期产生能够更快且更强大的训练模型。具体而言，我们提出了一种阅读全文

posted @ 2020-09-07 15:27 穷酸秀才大草包阅读(855) 评论(0) 推荐(0)

Evolved Policy Gradients

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ NeurIPS, (2018) Abstract 我们提出了一种元学习方法，用于学习基于梯度的RL算法。这个想法是要逐步形成一种可微的损失函数，这样智能体就可以通过优化其策略以最大程度地减少这种损失，获得较高的奖励。损失是通过智能体经验的阅读全文

posted @ 2020-09-07 14:54 穷酸秀才大草包阅读(433) 评论(0) 推荐(0)

穷酸秀才大艹包

导航

公告