2023 年 2月随笔档案 - 穷酸秀才大草包

Continuous improvement of self-driving cars using dynamic confidence-aware reinforcement learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Nature Machine Intelligence, 2023, 5(2): 145-158 Abstract 今天的自动驾驶汽车已经取得了令人印象深刻的驾驶能力，但在长尾情况下仍存在不确定性。用更多的数据训练基于强化学习的自动驾驶算阅读全文

posted @ 2023-02-28 15:23 穷酸秀才大草包阅读(1308) 评论(7) 推荐(0)

A Tandem Learning Rule for Effective Training and Rapid Inference of Deep Spiking Neural Networks

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 34, NO. 1, JANUARY 2023 Abstract 脉冲神经网络（SNN）代表了神经形态计算（N 阅读全文

posted @ 2023-02-23 17:38 穷酸秀才大草包阅读(241) 评论(0) 推荐(0)

Training Spiking Neural Networks with Local Tandem Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ 36th Conference on Neural Information Processing Systems (NeurIPS 2022) Abstract 脉冲神经网络（SNN）被证明在生物学上比它们的前辈更合理，更节能。然而，对于阅读全文

posted @ 2023-02-22 16:48 穷酸秀才大草包阅读(391) 评论(0) 推荐(0)

DeepMDP: Learning Continuous Latent Space Models for Representation Learning

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Proceedings of the 36 th International Conference on Machine Learning, Long Beach, California, PMLR 97, 2019 Abstract 许阅读全文

posted @ 2023-02-17 15:40 穷酸秀才大草包阅读(316) 评论(0) 推荐(0)

Learning Invariant Representations for Reinforcement Learning without Reconstruction

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ Published as a conference paper at ICLR 2021 ABSTRACT 我们研究了表征学习如何在不依赖领域知识或像素重建的情况下，从丰富的观察（如图像）中加速强化学习。我们的目标是学习提供有效下游控制和阅读全文

posted @ 2023-02-15 21:07 穷酸秀才大草包阅读(296) 评论(0) 推荐(0)

Anomaly Detection in Autonomous Driving: A Survey

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ CVPR Workshops 2022: 4487-4498 Abstract 如今，自动驾驶汽车在我们的道路上朝着未来迈出了卓越的步伐。尽管自动驾驶汽车在封闭条件下表现良好，但它们仍难以应对意外情况。这项调查提供了基于相机、激光雷达、雷阅读全文

posted @ 2023-02-10 17:38 穷酸秀才大草包阅读(252) 评论(0) 推荐(0)

ChatGPT: Optimizing Language Models for Dialogue

摘要：官网：https://openai.com/blog/chatgpt/ Methods 我们使用来自人类反馈的强化学习（RLHF）来训练这个模型，使用与InstructionGPT相同的方法，但数据收集设置略有不同。我们使用有监督的微调训练了一个初始模型：人工智能训练师提供对话，他们扮演用户和人工智阅读全文

posted @ 2023-02-08 16:12 穷酸秀才大草包阅读(712) 评论(0) 推荐(0)

Muesli: Combining Improvements in Policy Optimization

摘要：郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ ICML 2021: 4214-4226 Abstract 我们提出了一种新的策略更新，将正则化策略优化与模型学习相结合，作为辅助损失。这一更新（此后称为Muesli）与MuZero在Atari上的最先进性能相匹配。值得注意的是，Mues 阅读全文

posted @ 2023-02-08 11:11 穷酸秀才大草包阅读(149) 评论(0) 推荐(0)

穷酸秀才大艹包

02 2023 档案