摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Nature Machine Intelligence, 2023, 5(2): 145-158 Abstract 今天的自动驾驶汽车已经取得了令人印象深刻的驾驶能力,但在长尾情况下仍存在不确定性。用更多的数据训练基于强化学习的自动驾驶算
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 34, NO. 1, JANUARY 2023 Abstract 脉冲神经网络(SNN)代表了神经形态计算(N
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 36th Conference on Neural Information Processing Systems (NeurIPS 2022) Abstract 脉冲神经网络(SNN)被证明在生物学上比它们的前辈更合理,更节能。然而,对于
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Proceedings of the 36 th International Conference on Machine Learning, Long Beach, California, PMLR 97, 2019 Abstract 许
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Published as a conference paper at ICLR 2021 ABSTRACT 我们研究了表征学习如何在不依赖领域知识或像素重建的情况下,从丰富的观察(如图像)中加速强化学习。我们的目标是学习提供有效下游控制和
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! CVPR Workshops 2022: 4487-4498 Abstract 如今,自动驾驶汽车在我们的道路上朝着未来迈出了卓越的步伐。尽管自动驾驶汽车在封闭条件下表现良好,但它们仍难以应对意外情况。这项调查提供了基于相机、激光雷达、雷
阅读全文
摘要:官网:https://openai.com/blog/chatgpt/ Methods 我们使用来自人类反馈的强化学习(RLHF)来训练这个模型,使用与InstructionGPT相同的方法,但数据收集设置略有不同。我们使用有监督的微调训练了一个初始模型:人工智能训练师提供对话,他们扮演用户和人工智
阅读全文
摘要:郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! ICML 2021: 4214-4226 Abstract 我们提出了一种新的策略更新,将正则化策略优化与模型学习相结合,作为辅助损失。这一更新(此后称为Muesli)与MuZero在Atari上的最先进性能相匹配。值得注意的是,Mues
阅读全文