2021 年 6月 18 日随笔档案 - 穷酸秀才大草包

Synthetic Returns for Long-Term Credit Assignment

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract 从强化学习的早期开始，TD学习就一直是为动作分配信度的主要方法，它一步一步地向后传播信度。当动作和奖励之间的延迟很长，并且当干预的不相关事件导致长期回报的方差时，这种方法会受到影响。我们提出了状态联想(SA)学习，其中智阅读全文

posted @ 2021-06-18 16:34 穷酸秀才大草包阅读(148) 评论(0) 推荐(0)

Gradient-Free Neural Network Training via Synaptic-Level Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Preprint. Under review. Abstract 神经信息处理中的一个持续挑战是：神经元如何调整它们的连接性以随着时间的推移提高任务性能(即实现学习)？人们普遍认为，在特定的大脑区域，如基底节，有一个一致突触级的学习机制来阅读全文

posted @ 2021-06-18 16:05 穷酸秀才大草包阅读(158) 评论(0) 推荐(0)

Population-coding and Dynamic-neurons improved Spiking Actor Network for Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Arxiv 2021 Abstract 深度神经网络(DNN)作为强大的函数近似器，深度强化学习(DRL)在机器人控制任务中得到了出色的展示。与具有普通人工神经元的DNN相比，生物学合理的脉冲神经网络(SNN)包含多样化的脉冲神经元群体，阅读全文

posted @ 2021-06-18 15:05 穷酸秀才大草包阅读(793) 评论(6) 推荐(1)

穷酸秀才大艹包

导航

公告