Zer0_Chambers - 博客园

2023年9月12日

摘要： 1. MDP的最佳策略是确定性和无记忆的，一错会再错，以前发生的状态也不记得。Memory模块是正解吗？图源 https://zhuanlan.zhihu.com/p/430221668 2. 毫末吕迪对于RL现存问题的看法每个观点都很insight 强化学习领域目前遇到的瓶颈是什么? - 阅读全文

posted @ 2023-09-12 18:56 Zer0_Chambers 阅读(34) 评论(0) 推荐(0)

2023年8月10日

接！

该文被密码保护。阅读全文

posted @ 2023-08-10 01:45 Zer0_Chambers 阅读(5) 评论(0) 推荐(0)

2023年8月8日

【专栏阅读】World models

摘要：来源：如何理解Tesla和Wayve在CVPR2023 workshop上提到的world model？ - EatElephant的回答 - 知乎 https://www.zhihu.com/question/610849510/answer/3108529249 “CVPR 2023 自动驾驶w 阅读全文

posted @ 2023-08-08 12:59 Zer0_Chambers 阅读(400) 评论(0) 推荐(0)

2023年3月1日

接！

该文被密码保护。阅读全文

posted @ 2023-03-01 17:44 Zer0_Chambers 阅读(1) 评论(0) 推荐(0)

2023年2月17日

【0217】end2end自动驾驶方案想法

摘要：最近着重看了一些端到端的自动驾驶方案，有一些想法特点： 1.表现好，Carla leaderboard榜首几乎都是E2E，比如TCP，Transfuser, LAV2.逐渐偏重模块化的精细设计，并且中间量可以decode来可视化用以增强可解释性3.很多用GRU生成/refine轨迹，考虑waypo 阅读全文

posted @ 2023-02-17 19:02 Zer0_Chambers 阅读(102) 评论(0) 推荐(0)

2022年11月10日

【一些思考】关于anchor的理解，以及从本质上拓展到“轨迹候选集”的概念

摘要： 1.关于anchor的理解先看在目标检测领域的anchor的含义：https://www.zhihu.com/question/42205480/answer/155759667；https://zhuanlan.zhihu.com/p/84398108 最早用anchor的可能是Faster R 阅读全文

posted @ 2022-11-10 03:30 Zer0_Chambers 阅读(1029) 评论(0) 推荐(0)

2022年10月19日

【论文阅读】End-to-End Object Detection with Transformers（DETR）

摘要：摘要：提出了一个新的方法，把目标检测看作直接的集合的预测问题。消除了很多其他方法需要的手工设计的先验的环节，比如非极大抑制、anchor设计等。DETR是什么？DEtection TRansformer, 重要元素包含两项：基于集合的全局损失函数（用二部匹配进行唯一预测）以及一个transforme 阅读全文

posted @ 2022-10-19 14:11 Zer0_Chambers 阅读(75) 评论(0) 推荐(0)

2022年10月9日

【论文阅读】A Survey of State-Action Representations for Autonomous Driving

摘要：有段时间之前读的文章了，师兄推荐的，感觉挺好的，讲的是状态和动作的设计方式 1 表示车辆 1.1 Encodings 1.1.1 连续坐标系每辆车的状态用位置、车头朝向和速度表示：则所有车（N个）状态的集合描述了道路交通的复合状态：参考系可以是绝对的，但是通常采用ego-centric，以自车阅读全文

posted @ 2022-10-09 20:08 Zer0_Chambers 阅读(180) 评论(0) 推荐(0)

【论文阅读】A Survey of Deep Reinforcement Learning Algorithms for Motion Planning and Control of Autonomous Vehicles

摘要：摘要：看看RL怎么用在motion planning和control上。【读的时候没注意，才10引用，果然不太行】 1.INTRODUCTION 有监督学习每个任务都要一大堆标注数据，costly。而且不能覆盖所有复杂场景。RL没有以上两种缺点。决策和控制上使用的RL方法，分两类：分层方法(pip 阅读全文

posted @ 2022-10-09 19:42 Zer0_Chambers 阅读(139) 评论(0) 推荐(0)

2022年9月26日

【论文阅读】Safe Trajectory Generation for Complex Urban Environments Using Spatio-Temporal Semantic Corridor

摘要：有一篇可以参考的https://blog.csdn.net/u011841848/article/details/123173791 这篇文章代码在https://github.com/HKUST-Aerial-Robotics/spatiotemporal_semantic_corridor，有空阅读全文

posted @ 2022-09-26 22:07 Zer0_Chambers 阅读(1728) 评论(0) 推荐(0)

Zer0-Chambers

公告