穷酸秀才大草包

强化学习第2版第14章笔记——心理学

摘要：强化学习与心理学理论之间的一些对应关系并不令人感到惊讶，因为强化学习的发展受到了心理学理论的启发。强化学习是从人工智能研究者或工程师的角度探索理想化的情况，目的是用有效的算法解决计算问题，而不是复制或详细解释动物如何学习。因此，我们描述的一些对应关系将在各自领域中独立出现的想法联系起来。我们相信这阅读全文

posted @ 2020-08-14 15:43 穷酸秀才大草包阅读(1119) 评论(0) 推荐(0)

Rainbow: Combining Improvements in Deep Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1710.02298v1 [cs.AI] 6 Oct 2017 (AAAI 2018) Abstract 深度强化学习社区对DQN算法进行了一些独立的改进。但是，尚不清楚这些扩展中的哪些是互补的，是否可以有效地组合。本文研究了阅读全文

posted @ 2020-08-11 18:02 穷酸秀才大草包阅读(1283) 评论(0) 推荐(0)

强化学习模型实现RL-Adventure（DQN）

摘要： DQN Adventure: from Zero to State of the Art 阅读全文

posted @ 2020-08-08 17:15 穷酸秀才大草包阅读(1425) 评论(0) 推荐(0)

AI and Neuroscience: A virtuous circle

摘要：转载：https://deepmind.com/blog/article/ai-and-neuroscience-virtuous-circle AI领域最近取得了显著进展。人工系统现在优于人类专家Atari video games（Atari视频游戏），ancient board game Go（阅读全文

posted @ 2020-08-08 09:37 穷酸秀才大草包阅读(226) 评论(0) 推荐(0)

The Successor Representation: Its Computational Logic and Neural Substrates

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Received May 14, 2018; revised June 28, 2018; accepted July 5, 2018.This work was supported by the National Institutes 阅读全文

posted @ 2020-08-03 17:58 穷酸秀才大草包阅读(415) 评论(0) 推荐(0)

Biologically Inspired Reinforcement Learning: Reward-Based Decomposition for Multi-goal Environments

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract 我们提出了一种基于情绪的分层强化学习（HRL）算法，用于具有多种奖励来源的环境。该系统的架构受到大脑神经生物学的启发，特别是负责情绪，决策和行为执行的区域，分别是杏仁核，眶额皮质和基底神经节。学习问题根据奖励的来源而分解阅读全文

posted @ 2020-08-01 14:00 穷酸秀才大草包阅读(515) 评论(0) 推荐(0)

Discovering Reinforcement Learning Algorithms

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:2007.08794v1 [cs.LG] 17 Jul 2020 Abstract RL算法根据经过多年研究手动发现的几种可能规则之一来更新智能体的参数。从数据中自动发现更新规则可能会导致效率更高的算法，或者更适合特定环境的算阅读全文

posted @ 2020-07-27 20:11 穷酸秀才大草包阅读(678) 评论(0) 推荐(0)

Reinforcement Learning, Fast and Slow

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ 1 DeepMind, London, UK2 University College London, London, UK3 Princeton University, Princeton, NJ, USA*Correspondence: 阅读全文

posted @ 2020-07-27 11:31 穷酸秀才大草包阅读(683) 评论(0) 推荐(0)

Rethinking the performance comparison between SNNS and ANNS

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract ANN是通向AI的一种流行方法，它已经通过成熟的模型，各种基准，开源数据集和强大的计算平台获得了非凡的成功。SNN是一类有前途的模型，可以模拟大脑的神经元动态，已受到脑启发计算的广泛关注，并已广泛部署在神经形态设备上。但阅读全文

posted @ 2020-07-22 21:59 穷酸秀才大草包阅读(1839) 评论(0) 推荐(0)

Vector-based navigation using grid-like representations in artificial agents

摘要：然而，对于人工智能体而言，导航仍然是一个巨大的挑战，通过强化学习训练的深度神经网络3-5无法与哺乳动物空间行为的能力相提并论，而后者是由内嗅皮层中的网格细胞支持的6。网格细胞被认为提供了多尺度的周期性表示，用作编码空间的度量函数7,8，对于整合自我运动（路径整合）6,7,9和规划目标的直接轨迹（基于矢量的导航）7,10,11至关重要。阅读全文

posted @ 2020-07-21 17:43 穷酸秀才大草包阅读(1696) 评论(0) 推荐(0)

穷酸秀才大艹包

导航

公告