随笔档案「2020年8月30日」：Unsupervised Predictive Memory in a Goal... - 穷酸秀才大草包

Unsupervised Predictive Memory in a Goal-Directed Agent

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv: Learning, (2018) 尽管传感器的幅度和范围有限，动物仍会执行目标导向的行为。为了应对，他们探索环境并存储记忆，以维护对当前尚不可用的重要信息的估计(1)。最近，通过将RL算法与深度神经网络(2, 3)融合在一起阅读全文

posted @ 2020-08-30 22:37 穷酸秀才大草包阅读(283) 评论(0) 推荐(0)

Learning to Reinforcement Learn

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ CogSci, (2017) ABSTRACT 近年来，深度RL系统在许多具有挑战性的任务领域中都获得了超出人类的性能。但是，此类应用的主要局限性在于它们对大量训练数据的需求。因此，当前的一个关键目标是开发能够快速适应新任务的深度RL方法阅读全文

posted @ 2020-08-30 21:48 穷酸秀才大草包阅读(1791) 评论(0) 推荐(0)

Neuroscience-Inspired Artificial Intelligence

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ DOI：10.1016/j.neuron.2017.06.011 blog：http://www.ebrun.com/20170725/239411.shtml Abstract 历史上，神经科学和人工智能（AI）两个领域长期以来一直都存阅读全文

posted @ 2020-08-30 21:39 穷酸秀才大草包阅读(266) 评论(0) 推荐(0)

Why there are Complementary Learning Systems in the Hippocampus and Neocortex: Insights from the Successes and Failures of Connectionist Models of Learning and Memory

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Psychological review, no. 3 (1995): 419-457 Abstract 对海马体系统的损害破坏了最近的记忆，但保留了远端记忆。我们对此的解释表明，记忆首先是通过海马体系统中的突触变化来存储的。这些变化支持阅读全文

posted @ 2020-08-30 21:13 穷酸秀才大草包阅读(177) 评论(0) 推荐(0)

The value of what's to come: Neural mechanisms coupling prediction error and the utility of anticipation

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Science advances, no. 25 (2020) Abstract 有期待的事情是幸福的基石。对未来奖励（例如即将到来的假期）的期望通常比经验本身更令人满足。理论表明，预期的效用是各种行为的基础，从有益的信息寻求到有害的成瘾阅读全文

posted @ 2020-08-30 21:04 穷酸秀才大草包阅读(374) 评论(1) 推荐(0)

On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ arXiv:2007.04578v1 [cs.AI] 9 Jul 2020 Abstract 尽管深度RL模型显示出在最少的监督下解决各种任务的巨大潜力，但仍存在一些关键挑战，包括从有限的经验中快速学习，适应环境变化以及从单个任务中概括学阅读全文

posted @ 2020-08-30 20:56 穷酸秀才大草包阅读(237) 评论(0) 推荐(0)

穷酸秀才大艹包

导航

公告