随笔分类 -  类脑智能

上一页 1 ··· 5 6 7 8 9 10 下一页

Unsupervised Predictive Memory in a Goal-Directed Agent
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv: Learning, (2018) 尽管传感器的幅度和范围有限,动物仍会执行目标导向的行为。为了应对,他们探索环境并存储记忆,以维护对当前尚不可用的重要信息的估计(1)。最近,通过将RL算法与深度神经网络(2, 3)融合在一起 阅读全文

posted @ 2020-08-30 22:37 穷酸秀才大草包 阅读(281) 评论(0) 推荐(0)

Learning to Reinforcement Learn
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! CogSci, (2017) ABSTRACT 近年来,深度RL系统在许多具有挑战性的任务领域中都获得了超出人类的性能。但是,此类应用的主要局限性在于它们对大量训练数据的需求。因此,当前的一个关键目标是开发能够快速适应新任务的深度RL方法 阅读全文

posted @ 2020-08-30 21:48 穷酸秀才大草包 阅读(1767) 评论(0) 推荐(0)

Neuroscience-Inspired Artificial Intelligence
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! DOI:10.1016/j.neuron.2017.06.011 blog:http://www.ebrun.com/20170725/239411.shtml Abstract 历史上,神经科学和人工智能(AI)两个领域长期以来一直都存 阅读全文

posted @ 2020-08-30 21:39 穷酸秀才大草包 阅读(252) 评论(0) 推荐(0)

Why there are Complementary Learning Systems in the Hippocampus and Neocortex: Insights from the Successes and Failures of Connectionist Models of Learning and Memory
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Psychological review, no. 3 (1995): 419-457 Abstract 对海马体系统的损害破坏了最近的记忆,但保留了远端记忆。我们对此的解释表明,记忆首先是通过海马体系统中的突触变化来存储的。这些变化支持 阅读全文

posted @ 2020-08-30 21:13 穷酸秀才大草包 阅读(167) 评论(0) 推荐(0)

The value of what's to come: Neural mechanisms coupling prediction error and the utility of anticipation
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Science advances, no. 25 (2020) Abstract 有期待的事情是幸福的基石。对未来奖励(例如即将到来的假期)的期望通常比经验本身更令人满足。理论表明,预期的效用是各种行为的基础,从有益的信息寻求到有害的成瘾 阅读全文

posted @ 2020-08-30 21:04 穷酸秀才大草包 阅读(335) 评论(1) 推荐(0)

On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:2007.04578v1 [cs.AI] 9 Jul 2020 Abstract 尽管深度RL模型显示出在最少的监督下解决各种任务的巨大潜力,但仍存在一些关键挑战,包括从有限的经验中快速学习,适应环境变化以及从单个任务中概括学 阅读全文

posted @ 2020-08-30 20:56 穷酸秀才大草包 阅读(234) 评论(0) 推荐(0)

Deep Reinforcement Learning and Its Neuroscientific Implications
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 强大的人工智能(AI)的出现为神经科学定义了新的研究方向。迄今为止,这项研究主要集中于在诸如图像分类等任务中使用监督学习训练的深度神经网络。但是,目前AI工作还有另一个领域受到神经科学家的关注较少,但可能具有深远的神经科 阅读全文

posted @ 2020-08-27 14:16 穷酸秀才大草包 阅读(544) 评论(0) 推荐(1)

Play it again: reactivation of waking experience and memory
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Trends in Neurosciences, no. 5 (2010): 220-229 Abstract 回合空间记忆均涉及海马体神经元回路中复杂联想的编码。这种记忆轨迹可以通过巩固过程从短期到长期稳定下来,这种巩固过程涉及睡眠和休 阅读全文

posted @ 2020-08-17 17:31 穷酸秀才大草包 阅读(448) 评论(0) 推荐(0)

强化学习第2版第15章笔记——神经科学
摘要:神经科学是对神经系统的多学科研究的总称,主要包括:如何调节身体功能,如何控制行为,由发育、学习和老化所引起的随着时间的变化,以及细胞和分子机制如何使这些功能成为可能。强化学习的最令人兴奋的方面之一是来自神经科学的越来越多的证据表明,人类和许多其他动物的神经系统实施的算法和强化学习算法在很多方面是一一 阅读全文

posted @ 2020-08-15 17:43 穷酸秀才大草包 阅读(1432) 评论(0) 推荐(0)

强化学习第2版第14章笔记——心理学
摘要:强化学习与心理学理论之间的一些对应关系并不令人感到惊讶,因为强化学习的发展受到了心理学理论的启发。 强化学习是从人工智能研究者或工程师的角度探索理想化的情况,目的是用有效的算法解决计算问题,而不是复制或详细解释动物如何学习。因此,我们描述的一些对应关系将在各自领域中独立出现的想法联系起来。我们相信这 阅读全文

posted @ 2020-08-14 15:43 穷酸秀才大草包 阅读(1069) 评论(0) 推荐(0)

AI and Neuroscience: A virtuous circle
摘要:转载:https://deepmind.com/blog/article/ai-and-neuroscience-virtuous-circle AI领域最近取得了显著进展。人工系统现在优于人类专家Atari video games(Atari视频游戏),ancient board game Go( 阅读全文

posted @ 2020-08-08 09:37 穷酸秀才大草包 阅读(221) 评论(0) 推荐(0)

The Successor Representation: Its Computational Logic and Neural Substrates
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Received May 14, 2018; revised June 28, 2018; accepted July 5, 2018.This work was supported by the National Institutes 阅读全文

posted @ 2020-08-03 17:58 穷酸秀才大草包 阅读(394) 评论(0) 推荐(0)

Biologically Inspired Reinforcement Learning: Reward-Based Decomposition for Multi-goal Environments
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 我们提出了一种基于情绪的分层强化学习(HRL)算法,用于具有多种奖励来源的环境。该系统的架构受到大脑神经生物学的启发,特别是负责情绪,决策和行为执行的区域,分别是杏仁核,眶额皮质和基底神经节。学习问题根据奖励的来源而分解 阅读全文

posted @ 2020-08-01 14:00 穷酸秀才大草包 阅读(506) 评论(0) 推荐(0)

Rethinking the performance comparison between SNNS and ANNS
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract ANN是通向AI的一种流行方法,它已经通过成熟的模型,各种基准,开源数据集和强大的计算平台获得了非凡的成功。SNN是一类有前途的模型,可以模拟大脑的神经元动态,已受到脑启发计算的广泛关注,并已广泛部署在神经形态设备上。但 阅读全文

posted @ 2020-07-22 21:59 穷酸秀才大草包 阅读(1769) 评论(0) 推荐(0)

Vector-based navigation using grid-like representations in artificial agents
摘要:然而,对于人工智能体而言,导航仍然是一个巨大的挑战,通过强化学习训练的深度神经网络3-5无法与哺乳动物空间行为的能力相提并论,而后者是由内嗅皮层中的网格细胞支持的6。网格细胞被认为提供了多尺度的周期性表示,用作编码空间的度量函数7,8,对于整合自我运动(路径整合)6,7,9和规划目标的直接轨迹(基于矢量的导航)7,10,11至关重要 。 阅读全文

posted @ 2020-07-21 17:43 穷酸秀才大草包 阅读(1670) 评论(0) 推荐(0)

Prefrontal cortex as a meta-reinforcement learning system
摘要:在过去的20年中,基于奖励的学习的神经科学研究已经集中在经典模型上,在该模型中,神经递质多巴胺通过调节神经元之间突触连接的强度,“在情况,动作和奖励之间建立联系”。然而,越来越多的最新发现使该标准模型处于压力之下。现在,我们利用人工智能的最新进展来介绍基于奖励的学习的新理论。在这里,多巴胺系统训练大脑的另一部分,即前额叶皮层,作为其自己的独立式学习系统进行操作。 阅读全文

posted @ 2020-07-21 17:32 穷酸秀才大草包 阅读(912) 评论(0) 推荐(0)

Reinforcement learning in artificial and biological systems
摘要:在生物和人工系统的学习研究之间,已经有富有成果的概念和想法流。Bush and Mosteller,Rescorla and Wagner首先在生物中开发的学习规则启发了许多早期的工作,从而导致了针对人工系统的强化学习(RL)算法的开发。最近,为在人工智能体中学习而开发的时序差分RL为解释多巴胺神经元的活性提供了基础框架。 阅读全文

posted @ 2020-07-21 17:13 穷酸秀才大草包 阅读(584) 评论(0) 推荐(0)

Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to Atari Breakout game
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1903.11012v3 [cs.LG] 19 Aug 2019 Neural Networks, 25 November 2019 Abstract 深度强化学习(RL)在可以通过训练过的策略解决的任务上表现了出色的性能。在 阅读全文

posted @ 2020-07-18 17:20 穷酸秀才大草包 阅读(570) 评论(0) 推荐(0)

Reinforcement learning in populations of spiking neurons
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Nature neuroscience, no. 3 (2009): 250-252 Abstract 尽管存在神经元变异性,但是群体编码被广泛认为是实现可靠行为响应的重要机制。但是,随着全局奖励信号与任何单独神经元的性能越来越不相关,标 阅读全文

posted @ 2020-07-17 21:35 穷酸秀才大草包 阅读(303) 评论(0) 推荐(0)

Solving the Distal Reward Problem through Linkage of STDP and Dopamine Signaling
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! BMC Neuroscience, no. Suppl 2 (2007): 15-2 Abstract 在巴甫洛夫式和工具性条件下,奖励通常是在奖励触发动作几秒钟后产生的,从而产生了一个被称为"远端奖励问题"的解释难题:如果 1)奖励到达 阅读全文

posted @ 2020-07-17 21:14 穷酸秀才大草包 阅读(470) 评论(0) 推荐(0)

上一页 1 ··· 5 6 7 8 9 10 下一页

导航