2020 年 7月随笔档案 - 穷酸秀才大草包

Discovering Reinforcement Learning Algorithms

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:2007.08794v1 [cs.LG] 17 Jul 2020 Abstract RL算法根据经过多年研究手动发现的几种可能规则之一来更新智能体的参数。从数据中自动发现更新规则可能会导致效率更高的算法，或者更适合特定环境的算阅读全文

posted @ 2020-07-27 20:11 穷酸秀才大草包阅读(653) 评论(0) 推荐(0)

Reinforcement Learning, Fast and Slow

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ 1 DeepMind, London, UK2 University College London, London, UK3 Princeton University, Princeton, NJ, USA*Correspondence: 阅读全文

posted @ 2020-07-27 11:31 穷酸秀才大草包阅读(672) 评论(0) 推荐(0)

Rethinking the performance comparison between SNNS and ANNS

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract ANN是通向AI的一种流行方法，它已经通过成熟的模型，各种基准，开源数据集和强大的计算平台获得了非凡的成功。SNN是一类有前途的模型，可以模拟大脑的神经元动态，已受到脑启发计算的广泛关注，并已广泛部署在神经形态设备上。但阅读全文

posted @ 2020-07-22 21:59 穷酸秀才大草包阅读(1767) 评论(0) 推荐(0)

Vector-based navigation using grid-like representations in artificial agents

摘要：然而，对于人工智能体而言，导航仍然是一个巨大的挑战，通过强化学习训练的深度神经网络3-5无法与哺乳动物空间行为的能力相提并论，而后者是由内嗅皮层中的网格细胞支持的6。网格细胞被认为提供了多尺度的周期性表示，用作编码空间的度量函数7,8，对于整合自我运动（路径整合）6,7,9和规划目标的直接轨迹（基于矢量的导航）7,10,11至关重要。阅读全文

posted @ 2020-07-21 17:43 穷酸秀才大草包阅读(1669) 评论(0) 推荐(0)

Prefrontal cortex as a meta-reinforcement learning system

摘要：在过去的20年中，基于奖励的学习的神经科学研究已经集中在经典模型上，在该模型中，神经递质多巴胺通过调节神经元之间突触连接的强度，“在情况，动作和奖励之间建立联系”。然而，越来越多的最新发现使该标准模型处于压力之下。现在，我们利用人工智能的最新进展来介绍基于奖励的学习的新理论。在这里，多巴胺系统训练大脑的另一部分，即前额叶皮层，作为其自己的独立式学习系统进行操作。阅读全文

posted @ 2020-07-21 17:32 穷酸秀才大草包阅读(912) 评论(0) 推荐(0)

Reinforcement learning in artificial and biological systems

摘要：在生物和人工系统的学习研究之间，已经有富有成果的概念和想法流。Bush and Mosteller，Rescorla and Wagner首先在生物中开发的学习规则启发了许多早期的工作，从而导致了针对人工系统的强化学习（RL）算法的开发。最近，为在人工智能体中学习而开发的时序差分RL为解释多巴胺神经元的活性提供了基础框架。阅读全文

posted @ 2020-07-21 17:13 穷酸秀才大草包阅读(584) 评论(0) 推荐(0)

Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to Atari Breakout game

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1903.11012v3 [cs.LG] 19 Aug 2019 Neural Networks, 25 November 2019 Abstract 深度强化学习(RL)在可以通过训练过的策略解决的任务上表现了出色的性能。在阅读全文

posted @ 2020-07-18 17:20 穷酸秀才大草包阅读(570) 评论(0) 推荐(0)

Reinforcement learning in populations of spiking neurons

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Nature neuroscience, no. 3 (2009): 250-252 Abstract 尽管存在神经元变异性，但是群体编码被广泛认为是实现可靠行为响应的重要机制。但是，随着全局奖励信号与任何单独神经元的性能越来越不相关，标阅读全文

posted @ 2020-07-17 21:35 穷酸秀才大草包阅读(303) 评论(0) 推荐(0)

Solving the Distal Reward Problem through Linkage of STDP and Dopamine Signaling

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ BMC Neuroscience, no. Suppl 2 (2007): 15-2 Abstract 在巴甫洛夫式和工具性条件下，奖励通常是在奖励触发动作几秒钟后产生的，从而产生了一个被称为"远端奖励问题"的解释难题：如果 1）奖励到达阅读全文

posted @ 2020-07-17 21:14 穷酸秀才大草包阅读(470) 评论(0) 推荐(0)

Statistics and Samples in Distributional Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1902.08102v1 [stat.ML] 21 Feb 2019 Abstract 我们通过递归估计回报分布的统计量，提供了一个统一的框架，用于设计和分析分布强化学习（DRL）算法。我们的主要见识在于，可以将DRL算法分解阅读全文

posted @ 2020-07-15 09:53 穷酸秀才大草包阅读(575) 评论(0) 推荐(0)

Deep and Beautiful. The Reward Prediction Error Hypothesis of Dopamine

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Contents: Abstract 1. Introduction 2. Reward-Prediction Error Meets Dopamine 3. Reward-Prediction Error and Incentive S 阅读全文

posted @ 2020-07-10 15:01 穷酸秀才大草包阅读(738) 评论(0) 推荐(0)

Understanding dopamine and reinforcement learning: The dopamine reward prediction error hypothesis

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract 在中脑多巴胺能神经元的研究中取得了许多最新进展。要了解这些进步以及它们之间的相互关系，需要对作为解释框架并指导正在进行的实验探究的计算模型有深刻的理解。现在，理论和实验的这种相互交织非常清楚地表明，中脑多巴胺神经元的阶段阅读全文

posted @ 2020-07-10 14:44 穷酸秀才大草包阅读(568) 评论(0) 推荐(0)

A Distributional Perspective on Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1707.06887v1 [cs.LG] 21 Jul 2017 In International Conference on Machine Learning (2017). Abstract 在本文中，我们争论了价值分布的阅读全文

posted @ 2020-07-10 13:57 穷酸秀才大草包阅读(1718) 评论(1) 推荐(0)

Distributional Reinforcement Learning with Quantile Regression

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1710.10044v1 [cs.AI] 27 Oct 2017 In AAAI Conference on Artificial Intelligence (2018). Abstract 在强化学习中，智能体通过采取动作并阅读全文

posted @ 2020-07-10 13:45 穷酸秀才大草包阅读(1278) 评论(0) 推荐(0)

A distributional code for value in dopamine-based reinforcement learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Nature 2020 汇报PPT：链接：https://pan.baidu.com/s/1RWx6miX6iZUNgNfV9B69FQ 提取码：x5cz 基础概念：分位数：https://www.zhihu.com/question 阅读全文

posted @ 2020-07-08 17:20 穷酸秀才大草包阅读(632) 评论(0) 推荐(0)

在服务器上使用python-gym出现的显示问题

摘要：调用 env.render() 时出现了如下报错：NoSuchDisplayException: Cannot connect to "None" 阅读全文

posted @ 2020-07-07 14:57 穷酸秀才大草包阅读(826) 评论(0) 推荐(0)

如何为指定python解释器安装pip

摘要：anaconda3 安装pip3 阅读全文

posted @ 2020-07-07 14:16 穷酸秀才大草包阅读(2103) 评论(0) 推荐(0)

穷酸秀才大艹包

07 2020 档案