穷酸秀才大草包

Prefrontal cortex as a meta-reinforcement learning system

摘要：在过去的20年中，基于奖励的学习的神经科学研究已经集中在经典模型上，在该模型中，神经递质多巴胺通过调节神经元之间突触连接的强度，“在情况，动作和奖励之间建立联系”。然而，越来越多的最新发现使该标准模型处于压力之下。现在，我们利用人工智能的最新进展来介绍基于奖励的学习的新理论。在这里，多巴胺系统训练大脑的另一部分，即前额叶皮层，作为其自己的独立式学习系统进行操作。阅读全文

posted @ 2020-07-21 17:32 穷酸秀才大草包阅读(930) 评论(0) 推荐(0)

Reinforcement learning in artificial and biological systems

摘要：在生物和人工系统的学习研究之间，已经有富有成果的概念和想法流。Bush and Mosteller，Rescorla and Wagner首先在生物中开发的学习规则启发了许多早期的工作，从而导致了针对人工系统的强化学习（RL）算法的开发。最近，为在人工智能体中学习而开发的时序差分RL为解释多巴胺神经元的活性提供了基础框架。阅读全文

posted @ 2020-07-21 17:13 穷酸秀才大草包阅读(597) 评论(0) 推荐(0)

Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to Atari Breakout game

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1903.11012v3 [cs.LG] 19 Aug 2019 Neural Networks, 25 November 2019 Abstract 深度强化学习(RL)在可以通过训练过的策略解决的任务上表现了出色的性能。在阅读全文

posted @ 2020-07-18 17:20 穷酸秀才大草包阅读(577) 评论(0) 推荐(0)

Reinforcement learning in populations of spiking neurons

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Nature neuroscience, no. 3 (2009): 250-252 Abstract 尽管存在神经元变异性，但是群体编码被广泛认为是实现可靠行为响应的重要机制。但是，随着全局奖励信号与任何单独神经元的性能越来越不相关，标阅读全文

posted @ 2020-07-17 21:35 穷酸秀才大草包阅读(310) 评论(0) 推荐(0)

Solving the Distal Reward Problem through Linkage of STDP and Dopamine Signaling

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ BMC Neuroscience, no. Suppl 2 (2007): 15-2 Abstract 在巴甫洛夫式和工具性条件下，奖励通常是在奖励触发动作几秒钟后产生的，从而产生了一个被称为"远端奖励问题"的解释难题：如果 1）奖励到达阅读全文

posted @ 2020-07-17 21:14 穷酸秀才大草包阅读(476) 评论(0) 推荐(0)

Statistics and Samples in Distributional Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1902.08102v1 [stat.ML] 21 Feb 2019 Abstract 我们通过递归估计回报分布的统计量，提供了一个统一的框架，用于设计和分析分布强化学习（DRL）算法。我们的主要见识在于，可以将DRL算法分解阅读全文

posted @ 2020-07-15 09:53 穷酸秀才大草包阅读(597) 评论(0) 推荐(0)

Deep and Beautiful. The Reward Prediction Error Hypothesis of Dopamine

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Contents: Abstract 1. Introduction 2. Reward-Prediction Error Meets Dopamine 3. Reward-Prediction Error and Incentive S 阅读全文

posted @ 2020-07-10 15:01 穷酸秀才大草包阅读(753) 评论(0) 推荐(0)

Understanding dopamine and reinforcement learning: The dopamine reward prediction error hypothesis

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract 在中脑多巴胺能神经元的研究中取得了许多最新进展。要了解这些进步以及它们之间的相互关系，需要对作为解释框架并指导正在进行的实验探究的计算模型有深刻的理解。现在，理论和实验的这种相互交织非常清楚地表明，中脑多巴胺神经元的阶段阅读全文

posted @ 2020-07-10 14:44 穷酸秀才大草包阅读(586) 评论(0) 推荐(0)

A Distributional Perspective on Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1707.06887v1 [cs.LG] 21 Jul 2017 In International Conference on Machine Learning (2017). Abstract 在本文中，我们争论了价值分布的阅读全文

posted @ 2020-07-10 13:57 穷酸秀才大草包阅读(1737) 评论(1) 推荐(0)

Distributional Reinforcement Learning with Quantile Regression

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1710.10044v1 [cs.AI] 27 Oct 2017 In AAAI Conference on Artificial Intelligence (2018). Abstract 在强化学习中，智能体通过采取动作并阅读全文

posted @ 2020-07-10 13:45 穷酸秀才大草包阅读(1305) 评论(0) 推荐(0)

穷酸秀才大艹包

导航

公告