摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Arxiv 2022 Abstract 近年来,脉冲神经网络(SNN)由于其丰富的时空动力学、多种编码方法以及与神经形态硬件自然契合的事件驱动特性,在类脑智能领域受到了广泛关注。随着SNN的发展,类脑智能这一以脑科学成果为灵感、以通用人工
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 源码分析:rlpyt(Deep Reinforcement Learning in PyTorch) - 穷酸秀才大艹包 - 博客园 (cnblogs.com) Abstract 自从最近出现用于游戏的深度强化学习[1]和模拟机器人控制(
阅读全文
摘要:The External Sensor Interface.pptx - Google 云端硬盘 笔者对部分自己关注的内容进行了摘抄以及验证 Introduction 我们展示了外部传感器接口(ESI),这是一种新的电磁传感器模拟器,目前正在积极开发中,我们预计将在未来几个月发布第一个版本。 新的外
阅读全文
摘要:Sensors in CARLA, DVS Camera, carla.DVSEventArray
阅读全文
摘要:Core implementations: synchrony, snapshots and landmarks.pptx - Google 云端硬盘 笔者对部分自己关注的内容进行了摘抄以及验证 SYNCHRONOUS / ASYNCHRONOUS MODE How it works 我们有两种运行
阅读全文
摘要:Art Improvements: environment and rendering.pptx - Google 云端硬盘 笔者对部分自己关注的内容进行了摘抄以及验证 Lighting & Weather Environment.py --altitude X [-90 to 90] 海拔高度 -
阅读全文
摘要:[Paper] CARLA: An Open Urban Driving Simulator [Blog] CARLA: An Open Urban Driving Simulator [Web] CARLA Simulator [Documentation] CARLA Documentation
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! ICLR, (2020) ABSTRACT 在从专家演示中进行模仿学习时,分布匹配是一种流行的方法,其中一个在估计分布比率之间交替,然后在标准强化学习(RL)算法中使用这些比率作为奖励。传统上,分配比率的估计需要同策(on-policy)
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 30th Conference on Neural Information Processing Systems (NIPS 2016), Barcelona, Spain. Abstract 考虑从示例专家行为中学习策略,而不与专家交互
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 1st Conference on Robot Learning (CoRL 2017), Mountain View, United States. Abstract 我们介绍了用于自动驾驶研究的开源模拟器CARLA。CARLA是从头开
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 2019 IEEE INTELLIGENT TRANSPORTATION SYSTEMS CONFERENCE (ITSC), (2019): 2765-2771 Abstract 由于复杂的道路几何形状和多智能体交互,城市自动驾驶决策具
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Presented at the ICML 2017 Workshop on Machine Learning for Autonomous Vehicles Abstract 动态视觉传感器(DVS)和动态有源像素视觉传感器(DAVIS
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! International Conference on Robotics and Automation, (ICRA 2019) Abstract 我们展示了深度强化学习在自动驾驶中的首次应用。从随机初始化的参数中,我们的模型能够使用单个
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! IEEE ACCESS, (2020): 58443.0-58469.0 Abstract 自动驾驶系统(Automated driving system, ADS)承诺提供安全、舒适和高效的驾驶体验。然而,涉及配备ADS的车辆的死亡人数
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! ICLR 2019 ABSTRACT 基于最近在RL智能体分布式训练方面取得的成功,在本文中,我们研究了从分布式优先经验回放中对基于RNN的RL智能体的训练。我们研究了参数滞后导致表征漂移和循环状态陈旧的影响,并根据经验得出了改进的训练策
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! IEEE transactions on pattern analysis and machine intelligence, (2021) Abstract 深度强化学习(RL)智能体越来越精通一系列复杂的控制任务。然而,由于黑盒函数的
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! AAAI 2022 Abstract 本文提出了一种新的序列模型学习架构来解决部分可观察的马尔可夫决策问题。与传统的基于循环神经网络的方法在每个时间步骤压缩序列信息不同,所提出的架构在每个数据块中生成一个具有多个时间步骤的潜在变量,并将最
阅读全文
摘要:文章证明了max-over-time损失相对last-time-step损失的优势
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS 14, VOLS 1 AND 2, (2002): 1475.0-1482.0 Abstract 本文介绍了使用长短期记忆循环神经网络的强
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! JOURNAL OF NEUROPHYSIOLOGY, (2007) Abstract 脉冲时序依赖突触可塑性(STDP)已成为将突触前和突触后活动模式与突触强度变化联系起来的首选框架。尽管突触可塑性被广泛认为是学习的主要组成部分,但尚不
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! PLOS COMPUTATIONAL BIOLOGY, (2011) Abstract 计算神经科学领域的一个开放问题是如何将突触可塑性与系统级学习联系起来。在这种情况下,一个有前途的框架是时序差分(TD)学习。支持哺乳动物大脑执行时序差
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! AAAI 2022 Abstract 在深度神经网络(DNN)的帮助下,深度强化学习(DRL)在从游戏到机器人控制等许多复杂任务上取得了巨大成功。与具有部分受大脑启发的结构和功能的DNN相比,脉冲神经网络(SNN)考虑了更多的生物学特征,
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! IEEE transactions on pattern analysis and machine intelligence, (2022) 同组工作 Abstract 神经形态视觉传感器是近年来出现的一种新的仿生成像范式。它使用异步脉冲
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Bernstein Conference, 2020 Abstract 不断的适应可以在不断变化的世界中生存。神经元之间突触耦合强度的调整对于这种能力至关重要,使我们与更简单、硬连线的有机体区分开来。如何在现象学水平上以数学方式描述这些变
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! PLOS COMPUTATIONAL BIOLOGY, (2008): e1000180-e1000180 Abstract 奖励调节的脉冲时序依赖可塑性(STDP)最近已成为学习规则的候选者,该规则可以解释如何通过局部突触可塑性以自组织
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Neural Computation, (2007): 2245-2279 Abstract 学习智能体,无论是自然的还是人工的,都必须更新它们的内部参数,以便随着时间的推移改进它们的行为。在强化学习中,这种可塑性受到环境信号(称为奖励)
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! PHYSICAL REVIEW E, (2004): 041909-041909 Abstract 人工神经网络通常通过使用反向传播算法来计算目标函数相对于突触强度的梯度来训练。对于生物神经网络,由于神经元中内在和突触电导的复杂动力学,这
阅读全文