随笔档案「2021年6月」 - 穷酸秀才大草包

Reinforcement Learning in Spiking Neural Networks with Stochastic and Deterministic Synapses

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Neural Computation, no. 12 (2019): 2368-2389 Abstract 尽管成功解决了各种学习任务，但大多数现有的强化学习(RL)模型未能考虑到神经系统中突触可塑性的复杂性。使用脉冲神经元实现强化学习的阅读全文

posted @ 2021-06-26 14:30 穷酸秀才大草包阅读(612) 评论(0) 推荐(0)

Navigating Mobile Robots to Target in Near Shortest Time using Reinforcement Learning with Spiking Neural Networks

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ IJCNN, pp.2243-2250, (2017) Abstract 移动机器人在未知环境中的自主导航是移动机器人技术的一个重要课题。本文讨论了一种在未知环境中导航到已知目标位置的新策略，结合使用"go-to-goal"方法、强化学习阅读全文

posted @ 2021-06-22 21:29 穷酸秀才大草包阅读(245) 评论(0) 推荐(0)

A Spiking Neural Model for Stable Reinforcement of Synapses Based on Multiple Distal Rewards

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Neural Computation, no. 1 (2013): 123-156 Abstract 在这篇文章中，开发了一种新颖的类似critic的算法来扩展Florian (2007)和Izhikevich (2007)中描述的突触可阅读全文

posted @ 2021-06-22 17:47 穷酸秀才大草包阅读(208) 评论(0) 推荐(0)

Synthetic Returns for Long-Term Credit Assignment

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Abstract 从强化学习的早期开始，TD学习就一直是为动作分配信度的主要方法，它一步一步地向后传播信度。当动作和奖励之间的延迟很长，并且当干预的不相关事件导致长期回报的方差时，这种方法会受到影响。我们提出了状态联想(SA)学习，其中智阅读全文

posted @ 2021-06-18 16:34 穷酸秀才大草包阅读(157) 评论(0) 推荐(0)

Gradient-Free Neural Network Training via Synaptic-Level Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Preprint. Under review. Abstract 神经信息处理中的一个持续挑战是：神经元如何调整它们的连接性以随着时间的推移提高任务性能(即实现学习)？人们普遍认为，在特定的大脑区域，如基底节，有一个一致突触级的学习机制来阅读全文

posted @ 2021-06-18 16:05 穷酸秀才大草包阅读(168) 评论(0) 推荐(0)

Population-coding and Dynamic-neurons improved Spiking Actor Network for Reinforcement Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Arxiv 2021 Abstract 深度神经网络(DNN)作为强大的函数近似器，深度强化学习(DRL)在机器人控制任务中得到了出色的展示。与具有普通人工神经元的DNN相比，生物学合理的脉冲神经网络(SNN)包含多样化的脉冲神经元群体，阅读全文

posted @ 2021-06-18 15:05 穷酸秀才大草包阅读(846) 评论(6) 推荐(1)

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments环境代码详解

摘要：Github：https://github.com/openai/multiagent-particle-envs 论文Blog：Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments - 穷酸秀才大艹包 - 博阅读全文

posted @ 2021-06-08 23:15 穷酸秀才大草包阅读(1647) 评论(0) 推荐(0)

Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 30 (NIPS 2017), (2017): 6379-6390 代码分析（Blog）：Multi-Agent Actor-Critic 阅读全文

posted @ 2021-06-08 11:24 穷酸秀才大草包阅读(1375) 评论(1) 推荐(0)

穷酸秀才大艹包

06 2021 档案

导航

公告