穷酸秀才大草包

Meta-Q-Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICLR 2020 ABSTRACT 本文介绍了Meta-Q-Learning (MQL)，这是一种用于元强化学习(meta-RL)的新的异策算法。MQL基于三个简单的想法。首先，我们表明，如果可以访问表示过去轨迹的上下文变量，则Q学习将阅读全文

posted @ 2020-09-08 23:04 穷酸秀才大草包阅读(862) 评论(0) 推荐(0)

Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICML 2017 Abstract 我们提出了一种与模型无关的元学习算法，从某种意义上说，该算法可与通过梯度下降训练的任何模型兼容，并适用于各种不同的学习问题，包括分类，回归和RL。元学习的目标是针对各种学习任务训练模型，以便仅使用少量阅读全文

posted @ 2020-09-08 17:27 穷酸秀才大草包阅读(1000) 评论(0) 推荐(0)

Meta Learning via Learned Loss

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ CoRR, (2019) Abstract 通常，从有限的一组选项中试探性地选择损失函数，正则化机制和训练参数模型的其他重要方面。在本文中，我们将朝着使该过程自动化的第一步迈进，以期产生能够更快且更强大的训练模型。具体而言，我们提出了一种阅读全文

posted @ 2020-09-07 15:27 穷酸秀才大草包阅读(855) 评论(0) 推荐(0)

Evolved Policy Gradients

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ NeurIPS, (2018) Abstract 我们提出了一种元学习方法，用于学习基于梯度的RL算法。这个想法是要逐步形成一种可微的损失函数，这样智能体就可以通过优化其策略以最大程度地减少这种损失，获得较高的奖励。损失是通过智能体经验的阅读全文

posted @ 2020-09-07 14:54 穷酸秀才大草包阅读(433) 评论(0) 推荐(0)

Improving Generalization in Meta Reinforcement Learning using Learned Objectives

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Published as a conference paper at ICLR 2020 论文作者博客：http://louiskirsch.com/metagenrl ABSTRACT 生物进化将许多学习者的经验提炼为人类的通用学习算法阅读全文

posted @ 2020-09-06 23:01 穷酸秀才大草包阅读(854) 评论(0) 推荐(0)

RL^2: Fast Reinforcement Learning via Slow Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICLR 2017 ABSTRACT 深度RL已经成功地自动学习了复杂的行为。但是，学习过程需要大量的试验。相比之下，动物可以通过几次试验而学习新的任务，这得益于它们对世界的了解。本文力图弥合这一差距。与其设计一种"快速"的RL算法，不如阅读全文

posted @ 2020-09-06 16:32 穷酸秀才大草包阅读(1733) 评论(0) 推荐(0)

How to Construct Deep Recurrent Neural Networks

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICLR, (2014) Abstract 在本文中，我们探索了将RNN扩展到深度RNN的不同方法。我们首先争论说，RNN中的深度概念并不像前馈神经网络中的概念那么清晰。通过仔细分析和理解RNN的结构，我们发现RNN的三个方面可能会变得更阅读全文

posted @ 2020-09-04 17:41 穷酸秀才大草包阅读(502) 评论(0) 推荐(0)

Learning to Navigate in Complex Environments

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICLR 2017 ABSTRACT 在具有动态元素的复杂环境中学习导航是开发AI智能体的重要里程碑。在这项工作中，我们将导航问题表述为RL问题，并表明通过依靠利用多模式感官输入的额外辅助任务，可以显著提高数据效率和任务性能。特别是，我们阅读全文

posted @ 2020-09-04 15:44 穷酸秀才大草包阅读(435) 评论(0) 推荐(0)

Meta Networks

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICML, (2017) Abstract 神经网络已成功应用于带有大量标记数据的应用中。然而，在训练数据较少的情况下对新概念进行快速概括，同时保留先前学到的性能的任务仍然对神经网络模型提出了重大挑战。在这项工作中，我们介绍了一种新颖的元阅读全文

posted @ 2020-09-03 23:40 穷酸秀才大草包阅读(1586) 评论(0) 推荐(0)

Reinforcement Learning and Episodic Memory in Humans and Animals: An Integrative Framework

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Annual Review of Psychology, no. 1 (2017): 101-128 Abstract 我们回顾了RL的心理学和神经科学，在过去的二十年中，通过对简单学习和决策任务的综合实验研究，实现了重要的进步。但是，R 阅读全文

posted @ 2020-08-31 20:12 穷酸秀才大草包阅读(461) 评论(0) 推荐(0)

穷酸秀才大艹包

导航

公告