12 2020 档案

脉冲强化学习总结(持续更新)
摘要:脉冲强化学习(基于脉冲神经网络实现的强化学习算法)总结,分类,综述持续更新最新的文章及进展,欢迎大家补充评论 阅读全文

posted @ 2020-12-30 09:19 穷酸秀才大草包 阅读(4629) 评论(2) 推荐(0)

Q-learning and Pontryagin's Minimum Principle
摘要:摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Abstract Q学习是一种技术,用于基于对使用非最优策略控制的系统的观察来计算受控马尔可夫链的最优策略。事实证明,它对于具有有限状态和动作空间的模型有效。本文建立了具有通用状态空间和通用动作空间的连续时间模型的Q学习与非线性控制 阅读全文

posted @ 2020-12-28 17:39 穷酸秀才大草包 阅读(619) 评论(0) 推荐(0)

Control of synaptic plasticity in deep cortical networks
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Nature Reviews Neuroscience, no. 3 (2018): 166-180 Abstract 人类和许多其他动物具有学习感官刺激和掌握新技能的巨大能力。但是,保证我们学习的许多机制仍有待了解。系统神经科学的最大挑 阅读全文

posted @ 2020-12-23 15:37 穷酸秀才大草包 阅读(393) 评论(0) 推荐(0)

Reinforcement learning in cortical networks
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Encyclopedia of Computational Neuroscience, (2014) Definition RL代表AI和生物学学习的基本范例。该范式考虑了一种在典型的随机环境中采取动作并在达到某些状态时获得奖励的智能体( 阅读全文

posted @ 2020-12-22 17:16 穷酸秀才大草包 阅读(200) 评论(0) 推荐(0)

Computation by Time
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Neural Processing Letters, no. 1 (2015) Abstract 在过去的几年中,在SNN领域进行的研究数量一直在稳定增长。对脉冲神经元建模,以近似生物神经元的复杂动态行为。它们通过离散脉冲进行通信,并用这 阅读全文

posted @ 2020-12-22 09:31 穷酸秀才大草包 阅读(247) 评论(0) 推荐(0)

A Spiking Neural Network Model of an Actor-Critic Learning Agent
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Neural Computation, no. 2 (2009): 301-339 Abstract 与环境交互而适应行为以最大化奖励的能力对于任何高级生物的生存至关重要。在RL框架中,TD学习算法为这种目标导向的适应提供了有效的策略,但 阅读全文

posted @ 2020-12-17 09:26 穷酸秀才大草包 阅读(396) 评论(0) 推荐(0)

Biologically Inspired SNN for Robot Control
摘要:摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! IEEE Transactions on Cybernetics, no. 1 (2013): 115-128 Abstract 本文提出了一种基于SNN的机器人控制器,该控制器受生物系统的控制结构启发。通过使用具有短时可塑性的动态 阅读全文

posted @ 2020-12-16 21:55 穷酸秀才大草包 阅读(566) 评论(0) 推荐(0)

解决pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool
摘要:参考:https://blog.csdn.net/woai8339/article/details/91351707 pip --default-timeout=100 install tensorflow==2.0.0 -i https://pypi.tuna.tsinghua.edu.cn/si 阅读全文

posted @ 2020-12-15 21:58 穷酸秀才大草包 阅读(213) 评论(0) 推荐(0)

Reinforcement co-Learning of Deep and Spiking Neural Networks for Energy-Efficient Mapless Navigation with Neuromorphic Hardware
摘要:摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 2020 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 注:原翻译基于原先的arxiv版本,可能存在部分差异 Abstract 阅读全文

posted @ 2020-12-13 20:40 穷酸秀才大草包 阅读(1142) 评论(0) 推荐(0)

Deep Reinforcement Learning with Population-Coded Spiking Neural Network for Continuous Control
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 4th Conference on Robot Learning (CoRL 2020), Cambridge MA, USA. Abstract 移动机器人的节能控制已变得至关重要,因为它们在现实世界中的应用越来越复杂,涉及到高维观察/ 阅读全文

posted @ 2020-12-11 21:29 穷酸秀才大草包 阅读(739) 评论(0) 推荐(0)

A Survey of Robotics Control Based on Learning-Inspired Spiking Neural Networks
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Front. Neurorobot., (2018) Abstract 生物智能利用冲动或脉冲来处理信息,这使那些能够在现实世界中感知并采取动作的生物格外出色,并且几乎在生活的各个方面都胜过最先进的机器人。为了弥补这一不足,神经科学、电子 阅读全文

posted @ 2020-12-08 21:47 穷酸秀才大草包 阅读(694) 评论(0) 推荐(0)

The neurobiology of deep reinforcement learning
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Current biology : CB, no. 11 (2020) 为了产生适应性行为,动物必须从与环境的交互中学习。描述控制该学习过程的算法以及它们如何在大脑中实现是神经科学的主要目标。一百多个世纪以前,Thorndike,Pavl 阅读全文

posted @ 2020-12-08 15:58 穷酸秀才大草包 阅读(216) 评论(0) 推荐(0)

Reinforcement Learning Using a Continuous Time Actor-Critic Framework with Spiking Neurons
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Plos Computational Biology, 2013 Abstract 动物会重复奖励的行为,但基于奖励的学习的生理基础仅得到了部分阐明。一方面,实验证据表明神经调节剂多巴胺携带有关奖励的信息并影响突触可塑性。另一方面,RL理 阅读全文

posted @ 2020-12-08 15:51 穷酸秀才大草包 阅读(639) 评论(1) 推荐(0)

A neural reinforcement learning model for tasks with unknown time delays
摘要:SNN 强化学习 阅读全文

posted @ 2020-12-08 15:50 穷酸秀才大草包 阅读(420) 评论(0) 推荐(0)

开源脉冲神经网络深度学习框架——惊蛰(SpikingJelly)
摘要:开源脉冲神经网络深度学习框架——惊蛰(SpikingJelly) 背景 近年来神经形态计算芯片发展迅速,大量高校企业团队跟进,这样的芯片运行SNN的能效比与速度都超越了传统的通用计算设备。相应的,神经形态感知芯片也发展迅速。目前已有各种模态的感知芯片,其中如北京大学黄铁军教授团队的Vidar相机,功 阅读全文

posted @ 2020-12-07 16:51 穷酸秀才大草包 阅读(13700) 评论(5) 推荐(2)

Event-driven Random Backpropagation: Enabling Neuromorphic Deep Learning Machines
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Frontiers in neuroscience, (2017) Abstract 神经形态计算中的一项持续挑战是设计出与大脑的时空约束兼容的通用且计算效率高的推断和学习模型。梯度下降反向传播规则是深度学习中无处不在的强大算法,但是它依 阅读全文

posted @ 2020-12-04 20:15 穷酸秀才大草包 阅读(383) 评论(0) 推荐(0)

Towards spike-based machine intelligence with neuromorphic computing
摘要:Nature | 28 November 2019 阅读全文

posted @ 2020-12-04 16:41 穷酸秀才大草包 阅读(1299) 评论(0) 推荐(0)

PyTorch模型数据统计分析(模型每层形状、参数量、FLOPs)
摘要:PyTorch模型数据统计分析(模型每层形状、参数量、FLOPs) 阅读全文

posted @ 2020-12-01 20:11 穷酸秀才大草包 阅读(4023) 评论(0) 推荐(0)

导航