2020 年 8月随笔档案 - 穷酸秀才大草包

Reinforcement Learning and Episodic Memory in Humans and Animals: An Integrative Framework

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Annual Review of Psychology, no. 1 (2017): 101-128 Abstract 我们回顾了RL的心理学和神经科学，在过去的二十年中，通过对简单学习和决策任务的综合实验研究，实现了重要的进步。但是，R 阅读全文

posted @ 2020-08-31 20:12 穷酸秀才大草包阅读(438) 评论(0) 推荐(0)

What Learning Systems do Intelligent Agents Need? Complementary Learning Systems Theory Updated

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Trends in Cognitive Sciences, no. 7 (2016): 512-534 Abstract 我们更新了互补学习系统（CLS）理论，该理论认为，智能体必须拥有两个在新皮质和海马哺乳动物中实例化的学习系统。前者逐阅读全文

posted @ 2020-08-31 19:49 穷酸秀才大草包阅读(647) 评论(0) 推荐(0)

A deep learning framework for neuroscience

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！系统神经科学寻求有关大脑如何执行各种感知，认知和运动任务的解释。相反，AI试图根据必须解决的任务来设计计算系统。在ANN中，设计指定的三个组成部分是目标函数，学习规则和结构。随着利用脑启发性架构的深度学习取得越来越大的成功，这三个设计的组阅读全文

posted @ 2020-08-31 17:45 穷酸秀才大草包阅读(278) 评论(0) 推荐(0)

A critique of pure learning and what artificial neural networks can learn from animal brains

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ blog：https://www.cnblogs.com/xxdk/p/11928532.html Abstract 在更好的监督学习算法的推动下，ANN经历了一场革命。但是，与幼小的动物（包括人类）形成鲜明对比的是，训练这样的网络需要大阅读全文

posted @ 2020-08-31 17:08 穷酸秀才大草包阅读(146) 评论(0) 推荐(0)

Reward-based training of recurrent neural networks for cognitive and value-based tasks

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract 训练后的神经网络模型展现了从行为动物记录的神经活动的特征，可以通过对网络活动和连通性的系统分析来洞悉认知功能的电路机制。然而，与通常通过监督学习来训练网络的分级误差信号相反，动物通过RL从对确定动作的奖励反馈中学习。当最阅读全文

posted @ 2020-08-31 14:28 穷酸秀才大草包阅读(426) 评论(0) 推荐(0)

Unsupervised Predictive Memory in a Goal-Directed Agent

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv: Learning, (2018) 尽管传感器的幅度和范围有限，动物仍会执行目标导向的行为。为了应对，他们探索环境并存储记忆，以维护对当前尚不可用的重要信息的估计(1)。最近，通过将RL算法与深度神经网络(2, 3)融合在一起阅读全文

posted @ 2020-08-30 22:37 穷酸秀才大草包阅读(280) 评论(0) 推荐(0)

Learning to Reinforcement Learn

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ CogSci, (2017) ABSTRACT 近年来，深度RL系统在许多具有挑战性的任务领域中都获得了超出人类的性能。但是，此类应用的主要局限性在于它们对大量训练数据的需求。因此，当前的一个关键目标是开发能够快速适应新任务的深度RL方法阅读全文

posted @ 2020-08-30 21:48 穷酸秀才大草包阅读(1765) 评论(0) 推荐(0)

Neuroscience-Inspired Artificial Intelligence

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ DOI：10.1016/j.neuron.2017.06.011 blog：http://www.ebrun.com/20170725/239411.shtml Abstract 历史上，神经科学和人工智能（AI）两个领域长期以来一直都存阅读全文

posted @ 2020-08-30 21:39 穷酸秀才大草包阅读(252) 评论(0) 推荐(0)

Why there are Complementary Learning Systems in the Hippocampus and Neocortex: Insights from the Successes and Failures of Connectionist Models of Learning and Memory

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Psychological review, no. 3 (1995): 419-457 Abstract 对海马体系统的损害破坏了最近的记忆，但保留了远端记忆。我们对此的解释表明，记忆首先是通过海马体系统中的突触变化来存储的。这些变化支持阅读全文

posted @ 2020-08-30 21:13 穷酸秀才大草包阅读(166) 评论(0) 推荐(0)

The value of what's to come: Neural mechanisms coupling prediction error and the utility of anticipation

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Science advances, no. 25 (2020) Abstract 有期待的事情是幸福的基石。对未来奖励（例如即将到来的假期）的期望通常比经验本身更令人满足。理论表明，预期的效用是各种行为的基础，从有益的信息寻求到有害的成瘾阅读全文

posted @ 2020-08-30 21:04 穷酸秀才大草包阅读(331) 评论(1) 推荐(0)

On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:2007.04578v1 [cs.AI] 9 Jul 2020 Abstract 尽管深度RL模型显示出在最少的监督下解决各种任务的巨大潜力，但仍存在一些关键挑战，包括从有限的经验中快速学习，适应环境变化以及从单个任务中概括学阅读全文

posted @ 2020-08-30 20:56 穷酸秀才大草包阅读(234) 评论(0) 推荐(0)

Deep Reinforcement Learning and Its Neuroscientific Implications

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract 强大的人工智能（AI）的出现为神经科学定义了新的研究方向。迄今为止，这项研究主要集中于在诸如图像分类等任务中使用监督学习训练的深度神经网络。但是，目前AI工作还有另一个领域受到神经科学家的关注较少，但可能具有深远的神经科阅读全文

posted @ 2020-08-27 14:16 穷酸秀才大草包阅读(543) 评论(0) 推荐(1)

实用科研工具/网站集

摘要：在这里mark一下我收藏的一些实用的科研网站（有些常用的我就不列举了），欢迎大家评论补充！！！阅读全文

posted @ 2020-08-23 16:25 穷酸秀才大草包阅读(2003) 评论(0) 推荐(0)

rlpyt（Deep Reinforcement Learning in PyTorch）

摘要：rlpyt: A Research Code Base for Deep Reinforcement Learning in PyTorch Github：https://github.com/astooke/rlpyt Introduction (CH)：https://baijiahao.bai 阅读全文

posted @ 2020-08-21 14:52 穷酸秀才大草包阅读(509) 评论(0) 推荐(0)

conda命令详解

摘要：安装Conda 直接使用Miniconda3-latest-Linux-x86_64.sh安装更为精简快捷查看环境： conda env listconda info --envs 创建环境： conda create -n env_name python=3.x 进入环境： source act 阅读全文

posted @ 2020-08-21 10:59 穷酸秀才大草包阅读(1972) 评论(0) 推荐(0)

强化学习中的经验回放（The Experience Replay in Reinforcement Learning）

摘要：强化学习中的经验回放（The Experience Replay in Reinforcement Learning）阅读全文

posted @ 2020-08-19 15:29 穷酸秀才大草包阅读(10490) 评论(0) 推荐(1)

Revisiting Fundamentals of Experience Replay

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICML 2020 Abstract 经验回放对于深度RL中的异策算法至关重要，但是在我们的理解上仍然存在很大差距。因此，我们对Q学习方法中的经验回放进行了系统且广泛的分析，重点是两个基本属性：回放容量和学习更新与所收集经验的比率(回放率阅读全文

posted @ 2020-08-18 18:59 穷酸秀才大草包阅读(729) 评论(0) 推荐(1)

Word操作之参考文献自动关联和引用

摘要：转载：https://blog.csdn.net/qq_40078121/article/details/88681605 编号选项->定义新编号格式；选择插入->交叉引用选项；然后选中[1]，使用“Ctrl Shift +”快捷键使其变成上角标。阅读全文

posted @ 2020-08-18 17:55 穷酸秀才大草包阅读(973) 评论(0) 推荐(0)

Play it again: reactivation of waking experience and memory

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Trends in Neurosciences, no. 5 (2010): 220-229 Abstract 回合空间记忆均涉及海马体神经元回路中复杂联想的编码。这种记忆轨迹可以通过巩固过程从短期到长期稳定下来，这种巩固过程涉及睡眠和休阅读全文

posted @ 2020-08-17 17:31 穷酸秀才大草包阅读(448) 评论(0) 推荐(0)

强化学习第二版第17章笔记——前沿技术

摘要：在本章中大家将接触一些超出本书范围的话题，但是我们认为这些话题对于强化学习的未来非常重要。很多话题会超出我们所熟知的知识范围，并且有些会把我们带出马尔可夫决策过程(MDP)框架。 17.1 广义价值函数和辅助任务不管在这种类似于价值函数的预测过程中，我们累加的是什么信号，我们都称其为这种预测的累积阅读全文

posted @ 2020-08-16 22:42 穷酸秀才大草包阅读(368) 评论(0) 推荐(0)

强化学习第2版第15章笔记——神经科学

摘要：神经科学是对神经系统的多学科研究的总称，主要包括：如何调节身体功能，如何控制行为，由发育、学习和老化所引起的随着时间的变化，以及细胞和分子机制如何使这些功能成为可能。强化学习的最令人兴奋的方面之一是来自神经科学的越来越多的证据表明，人类和许多其他动物的神经系统实施的算法和强化学习算法在很多方面是一一阅读全文

posted @ 2020-08-15 17:43 穷酸秀才大草包阅读(1430) 评论(0) 推荐(0)

强化学习第2版第14章笔记——心理学

摘要：强化学习与心理学理论之间的一些对应关系并不令人感到惊讶，因为强化学习的发展受到了心理学理论的启发。强化学习是从人工智能研究者或工程师的角度探索理想化的情况，目的是用有效的算法解决计算问题，而不是复制或详细解释动物如何学习。因此，我们描述的一些对应关系将在各自领域中独立出现的想法联系起来。我们相信这阅读全文

posted @ 2020-08-14 15:43 穷酸秀才大草包阅读(1067) 评论(0) 推荐(0)

Rainbow: Combining Improvements in Deep Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:1710.02298v1 [cs.AI] 6 Oct 2017 (AAAI 2018) Abstract 深度强化学习社区对DQN算法进行了一些独立的改进。但是，尚不清楚这些扩展中的哪些是互补的，是否可以有效地组合。本文研究了阅读全文

posted @ 2020-08-11 18:02 穷酸秀才大草包阅读(1268) 评论(0) 推荐(0)

强化学习模型实现RL-Adventure（DQN）

摘要：DQN Adventure: from Zero to State of the Art 阅读全文

posted @ 2020-08-08 17:15 穷酸秀才大草包阅读(1406) 评论(0) 推荐(0)

AI and Neuroscience: A virtuous circle

摘要：转载：https://deepmind.com/blog/article/ai-and-neuroscience-virtuous-circle AI领域最近取得了显著进展。人工系统现在优于人类专家Atari video games（Atari视频游戏），ancient board game Go（阅读全文

posted @ 2020-08-08 09:37 穷酸秀才大草包阅读(220) 评论(0) 推荐(0)

The Successor Representation: Its Computational Logic and Neural Substrates

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Received May 14, 2018; revised June 28, 2018; accepted July 5, 2018.This work was supported by the National Institutes 阅读全文

posted @ 2020-08-03 17:58 穷酸秀才大草包阅读(394) 评论(0) 推荐(0)

Biologically Inspired Reinforcement Learning: Reward-Based Decomposition for Multi-goal Environments

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract 我们提出了一种基于情绪的分层强化学习（HRL）算法，用于具有多种奖励来源的环境。该系统的架构受到大脑神经生物学的启发，特别是负责情绪，决策和行为执行的区域，分别是杏仁核，眶额皮质和基底神经节。学习问题根据奖励的来源而分解阅读全文

posted @ 2020-08-01 14:00 穷酸秀才大草包阅读(506) 评论(0) 推荐(0)

穷酸秀才大艹包

08 2020 档案