2020年7月21日

摘要: 然而,对于人工智能体而言,导航仍然是一个巨大的挑战,通过强化学习训练的深度神经网络3-5无法与哺乳动物空间行为的能力相提并论,而后者是由内嗅皮层中的网格细胞支持的6。网格细胞被认为提供了多尺度的周期性表示,用作编码空间的度量函数7,8,对于整合自我运动(路径整合)6,7,9和规划目标的直接轨迹(基于矢量的导航)7,10,11至关重要 。 阅读全文
posted @ 2020-07-21 17:43 穷酸秀才大草包 阅读(1675) 评论(0) 推荐(0)
摘要: 在过去的20年中,基于奖励的学习的神经科学研究已经集中在经典模型上,在该模型中,神经递质多巴胺通过调节神经元之间突触连接的强度,“在情况,动作和奖励之间建立联系”。然而,越来越多的最新发现使该标准模型处于压力之下。现在,我们利用人工智能的最新进展来介绍基于奖励的学习的新理论。在这里,多巴胺系统训练大脑的另一部分,即前额叶皮层,作为其自己的独立式学习系统进行操作。 阅读全文
posted @ 2020-07-21 17:32 穷酸秀才大草包 阅读(912) 评论(0) 推荐(0)
摘要: 在生物和人工系统的学习研究之间,已经有富有成果的概念和想法流。Bush and Mosteller,Rescorla and Wagner首先在生物中开发的学习规则启发了许多早期的工作,从而导致了针对人工系统的强化学习(RL)算法的开发。最近,为在人工智能体中学习而开发的时序差分RL为解释多巴胺神经元的活性提供了基础框架。 阅读全文
posted @ 2020-07-21 17:13 穷酸秀才大草包 阅读(585) 评论(0) 推荐(0)

导航