2021年6月18日

摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract 从强化学习的早期开始,TD学习就一直是为动作分配信度的主要方法,它一步一步地向后传播信度。当动作和奖励之间的延迟很长,并且当干预的不相关事件导致长期回报的方差时,这种方法会受到影响。我们提出了状态联想(SA)学习,其中智 阅读全文
posted @ 2021-06-18 16:34 穷酸秀才大草包 阅读(148) 评论(0) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Preprint. Under review. Abstract 神经信息处理中的一个持续挑战是:神经元如何调整它们的连接性以随着时间的推移提高任务性能(即实现学习)?人们普遍认为,在特定的大脑区域,如基底节,有一个一致突触级的学习机制来 阅读全文
posted @ 2021-06-18 16:05 穷酸秀才大草包 阅读(158) 评论(0) 推荐(0)
摘要: 郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Arxiv 2021 Abstract 深度神经网络(DNN)作为强大的函数近似器,深度强化学习(DRL)在机器人控制任务中得到了出色的展示。与具有普通人工神经元的DNN相比,生物学合理的脉冲神经网络(SNN)包含多样化的脉冲神经元群体, 阅读全文
posted @ 2021-06-18 15:05 穷酸秀才大草包 阅读(793) 评论(6) 推荐(1)

导航