2020年8月30日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv: Learning, (2018) 尽管传感器的幅度和范围有限,动物仍会执行目标导向的行为。为了应对,他们探索环境并存储记忆,以维护对当前尚不可用的重要信息的估计(1)。最近,通过将RL算法与深度神经网络(2, 3)融合在一起 阅读全文
posted @ 2020-08-30 22:37 穷酸秀才大草包 阅读(281) 评论(0) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! CogSci, (2017) ABSTRACT 近年来,深度RL系统在许多具有挑战性的任务领域中都获得了超出人类的性能。但是,此类应用的主要局限性在于它们对大量训练数据的需求。因此,当前的一个关键目标是开发能够快速适应新任务的深度RL方法 阅读全文
posted @ 2020-08-30 21:48 穷酸秀才大草包 阅读(1773) 评论(0) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! DOI:10.1016/j.neuron.2017.06.011 blog:http://www.ebrun.com/20170725/239411.shtml Abstract 历史上,神经科学和人工智能(AI)两个领域长期以来一直都存 阅读全文
posted @ 2020-08-30 21:39 穷酸秀才大草包 阅读(255) 评论(0) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Psychological review, no. 3 (1995): 419-457 Abstract 对海马体系统的损害破坏了最近的记忆,但保留了远端记忆。我们对此的解释表明,记忆首先是通过海马体系统中的突触变化来存储的。这些变化支持 阅读全文
posted @ 2020-08-30 21:13 穷酸秀才大草包 阅读(170) 评论(0) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Science advances, no. 25 (2020) Abstract 有期待的事情是幸福的基石。对未来奖励(例如即将到来的假期)的期望通常比经验本身更令人满足。理论表明,预期的效用是各种行为的基础,从有益的信息寻求到有害的成瘾 阅读全文
posted @ 2020-08-30 21:04 穷酸秀才大草包 阅读(339) 评论(1) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:2007.04578v1 [cs.AI] 9 Jul 2020 Abstract 尽管深度RL模型显示出在最少的监督下解决各种任务的巨大潜力,但仍存在一些关键挑战,包括从有限的经验中快速学习,适应环境变化以及从单个任务中概括学 阅读全文
posted @ 2020-08-30 20:56 穷酸秀才大草包 阅读(234) 评论(0) 推荐(0)

导航