[信息分享] 汽车激光雷达及大疆激目

Ref.: 花了几万买的激光雷达,只是在你车上悄悄摸鱼?【差评君】

Source: https://www.bilibili.com/video/BV17J4m1E7h2/?spm_id_from=333.337.search-card.all.click&vd_source=c6c4b172822389537c9c35f2b3e89af5

激目

激光雷达一直是很多车企又爱又恨的东西,因为这玩意确实能增加自家的可靠性,但问题却也不少。
但这次在北京车展一直在搞纯视觉,自家的大疆车载拿出了他们带激光雷达的方案,激目非常有意思。
首先这是一个集成产品,这么一块东西,就顶了其他车支架所需要的一大堆传感器,并且为未来的L3做好了支持。
其次这个积木它是装在挡风玻璃后面,大疆车载居然把发热噪音给解决了,过了车规非常之优雅。
最重要的是,这一整个又有相机,又有激光雷达的新生物,竟然比市面上所有的激光雷达单机还要便宜。
而了解完他的整个技术,我感觉大疆车载,打开了一种激光雷达的全新思路。

大疆车载 - 激光雷达方案

大家好,我是攒钱提车的差评君。
今天我们来聊一种可能是未来的激光雷达方案,在解释大疆车载的方案之前
我们得先了解一下智驾是怎么工作的
我们知道这架最关键的步骤就是,用机器视觉算法让车学会自己看路。
车要开起来,首先得知道路上有什么路口?是红灯?是绿灯?前头有没有人?后面有没有车?乃至于走的是二仙桥还是成华大道?
这些信息通常被称作语义信息
是通过车载摄像头拍摄照片采集的,当然要把车开起来。
只知道面前的东西是什么还不够,还得知道物体的深度信息,也就是有多远
所以一只眼睛不够,得要两只。
我们可以试试在闭一只眼的情况下
尝试将笔盖笔合在一起
就会发现很容易错位
如果我们把两只眼睛都睁开
却很容易就能做到
这是因为只用一只眼睛
无法确认物体在三维世界内
和眼睛视线平行的那条轴上真实的相对位置
而如果用两只眼睛来看
就能得到两个角度的结果
大脑就能根据这两张平面图的对比
得出相对位置关系
渲染出距离
纯视觉自家方案测量深度信息的原理也是一样
两个摄像头会先拍下两个角度的照片
再把两张照片给到模型
再通过两张照片的视角差算法
就能估计出物体大概的相对位置
除了基于双目视觉三角测量的算
我们还可以更直接一点
用激光雷达去量
我们知道激光可以用来精准的测距
往物体上发射一束光
当光遇到物体反射回来
记录下光返回的时间
再乘以光速
就可以得到光源和物体之间的相对距离
比起视觉
这更像是某种触觉
靠的是激光去摸物体的轮廓
不会受到环境光线和距离的干扰
如果我们同时发射很多数这样的光到物体表面
那么每一束光的反射
都能得到物体表面上一个点的距离
再把这些点组合在一起
我们就能得到一片标记的周遭环境与障碍物
三维坐标分布的点云
所以在摄像头的眼中
运动中的物体位置实际上是一团模糊的雾
而点云则能精确地识别出运动中物体的轮廓
甚至是它的运动轨迹
从而更好地做出行规划
2017年
举办的自动驾驶挑战赛中
来自斯坦福大学的研究团队
就是利用激光雷达方案
首次在人工不介入的前提下
跑完了60多公里的赛程
这在当年引起了巨大的轰动
甚至说是自动驾驶从理论变成工程问题
历史性的一步
但是比起当年
现在的激光雷达性能已经进化了很多
为什么指甲还是不够好开呢
这其实是因为在自家的决策过程中
有时候会看着激光雷达返回的数据一脸懵逼
实际上激光雷达生成的点云中只有深度信息
没有语义信息是无法独立工作的
只有结合语义信息才能成为有意义的数据
最原始的结合方式是后融合
就是让摄像头做学生近光雷达
做导师
在摄像头独立标注完语音信息和深度信息之后
再把拿不准的地方用激光雷达的数据检查一遍
比如现在前面有个路障
摄像头会先独立工作
在画面中用一个框标出路障的大概位置和距离
激光雷达再确认一下
这个框里是不是有一个障碍物
只扮演一个说是或不是的角色
与后融合对应的
还有一种激光雷达参与度更高的前融合
这种方式下
激光雷达和摄像头的关系从师生变成了同学
还是做同一套卷子
但是这次不是一个人讲
一个人听了
而是两个人先把题都抄了一遍
然后互相交换了草稿纸之后再分别开始做题
最简单和普遍的做法是把点云投影到图像
然后检查电源是否属于图像中检测的
2D目标框
具体来说就是用摄像机会拍下带有路障的照片
并且通过特征识别算法把路障框出来
然后在点云中把这个框对应的位置标记出来
记录一下这块点云表示的是一个路障
但是不管是做师徒还是做同学
激光雷达和摄像头本质上都是独立工作的
这个过程中
激光雷达的作用可以说是如有流程上
他确实参与了
但是具体到每次决策中
他到底起了多大作用
就很难说
两双眼睛两张嘴
最后拍板听谁的
那可不一定要看具体的算法到底怎么样
这也是为什么有些用户对激光雷达感知不强
甚至有时候把激光雷达用胶布贴起来
都感觉不到区别的原因
所以虽然很多车企觉得支架不够好
就应该换性能更强的雷达力大砖飞
但实际上要垂下支架
这颗钉子可能需要的并不是一把更大的锤子
那既然现在限制自家发展的是体系
那有没有什么办法让激光雷达
这把锤子发挥更好的作用呢
可能有的茶友已经看出来了
不管是前融合还是后融合
都是摄像头和激光雷达配合完成
两者之间并不是很多人认为的
非此即彼的平行线也不存在
很多人想象中视觉不靠谱
激光雷达来找补的非此即彼的竞争关系
用激光雷达不代表视觉不重要
正相反想用好激光雷达
首先得玩命脉
视觉只有把视觉用透
知道如何调用算法
让摄像头获得丰富准确的信息
才能让这些信息和激光雷达结合
如果视觉做的不给力
就算再强的激光雷达也救不了
而大疆车载的视觉一直就玩的很溜
这次北京车展上
大疆车载带来的积木
就是在视觉方案积累的基础上
走出了一条激光雷达新思路
积木之所以能做出这么好的效果
是因为他重新发明了抡锤子的方法
要让摄像头和激光雷达对齐
并不是一件简单的事
首先是空间上两个传感器不在同一个位置
激光雷达一般装在车顶或者车头上
而前置摄像头
却一般装在前挡风玻璃的额头上面
这也导致了两个传感器的视野原点不一致
所以同样一个路障在摄像头的照片里
他可能在画面的这个地方
而在激光雷达里
它却在这里
所以要让两组数据能够匹配
就得先找出点音关系图
和摄像头拍下照片上同一个物体的对应关系
然后计算出两个坐标系的转换关系
但是这种标签的结果并非永远可靠
即使在为了保证准确性
通常在测试量产维修三个环节中
都会各自进行一次这样的标定
但因为环境的影响
标定的坐标系往往和实际的位置关系
还是会有一定的偏移
在多次的标定中
这种影响还会逐次叠加
导致点云在图像上投的不准
最终影响支架系统的判断
另一方面
由于摄像头和激光雷达
分别有一套自己的图像处理流程
两者的时间线即使在标定之后
也依然会存在有毫秒级的误差
所以积木方案既没有采用结果层面的后融合
也没有采用数据层面的前融合
而是采用了从硬件设计层面就考虑
数据融合的前前融合方案
大疆车载的想法是
既然激光雷达和摄像头总是要合作的
与其让他们分开做卷子
不如一开始就商量着一起来
那要怎么才能打通两个部门的颗粒度呢
实际上积木并不是一个传统意义上的激光雷达
而是一个封装了三颗摄像头和激光雷达的器件
它集成了一对双目摄像头
一颗激光雷达和一颗
用来提升检测距离的长焦摄像头
而且也不像传统的激光雷达一样
装在车顶或者车头
而这套摄像头以及封装到了前挡玻璃后面
传统方案之所以标的这么麻烦
是因为摄像头和激光雷达的视野不同
而在积木中
两种传感器之间是通过物理结构刚性连接
在同一结构中的
同桌看题的视角大致相同
交流起来更方便了
这就让积木中两个传感器的标定难度
相较于传统方案得以大大降低
准确度也提升了很多
实际上积木只需要在生产模组时进行一次标定
在后面装车和维修的时候
都不需要再重复标定的操作
就能做到亚像素级的精度
除了换做之外
积木的另一个创新是
让激光雷达和摄像头用同一个大脑解题
之前
激光雷达有力
使不出的另一个重要原因就是
视觉方案和雷达方案解题的草稿对不上
不管是后轮和一个做一个改
还是前任和抄完体后交换草稿纸
摄像头和激光雷达两套方案都是独立运作
分别生成点云图和标注图片的
这使得算法在大多数情况下
都是在二手信息上勾勾画画
而积木方案一开始就只关心特征
数据不再融合前对信息做处理
在积木中
激光雷达和摄像头既不是师生
也不是同学
而是同一个大脑下的两双眼睛
他移除了摄像头和激光雷达中的计算芯片
把它们变成了更单纯的眼睛
摄像头的作用不再是拍照片路障
也不再是照片上被框选中的区域
而是一组能够表达对应语音信息的数字信号
激光雷达也不再把接收到的信号转化成点云
而是把激光雷达原始回波信号
直接发给自家域控制器
在预控制器里
这两种信号再被融合成携带深度信息的点云图
预控制器并不分辨哪些数据是来自摄像头的
哪些是激光雷达的
而是在这个融合信息整体的基础上做出决策
比如激光雷达都能利用相机图像中丰富的信息
准确去噪声代替简单粗暴的滤波方法
解决噪声和串扰问题
得到的质量和还原度都更高的点云
在深入了解大疆车载的积木方案之后
查明尼也不禁思考
在这个车圈越来越卷的时代
它到底给自家带来了什么
其更高的逼格还是更强的硬件
还是更醒目的数字
这似乎都不是一个正确的答案
在查明君看来
积木自的就让激光雷达重回了解决问题的正轨
苹果在推出ipad pro的时候
喊出过一句著名的slogan
你的下一台电脑何必是电脑
积木似乎也在尝试用实践证明
下一个激光雷达并不必要是更大的锤子
更高级别自动驾驶
或者更高端舒适的辅助驾驶体验
都需要精确的点云
但这样的点云一定要通过高限速的
昂贵的激光雷达来提供吗
其实并不一定
有许多造雷达的努力在提高限速
造更大的锤子
有许多锤钉子的还在努力练习抡锤的手法
尝试不同的锤子
而大量车载直接给了一个锤好的挂机
只需要把功能这幅画挂上去就好了
这是属于大疆车载的独门锤子
很清亮很特别
实际上
激光雷达的问题一直是在系统里好不好用
但往往被误解成了性能不够用
积木方案的成功很大程度上就源于大疆车载
对这种主要矛盾的精确把控
在积木的设计之初
就考虑到了它的使用场景和性能需求
围绕这个需求
设计了一套能够实现这个需求的方案
而不是为了怼数据而堆硬件
也许积木不一定是现在最大最炫的锤子
但造锤子本身也从来不是一个问题
砸钉子才是
这是一条和追求性能不同的和工程师的思路
大量车载追求的不是参数上的堆料
而是如何用最朴素的基础
依然能够获得高水平的结果
需求为始
落地为终
有着如何触发的情形
也有遇水家族的坚持
这也许才是真正的工程师精神
好了
这里是饼君
这就是今天的内容
如果你觉得好的话
欢迎你一键三连
如果你有什么想说的
欢迎你在评论区和我互动
最后拜托的关注一下
我们也可以关注一下我们的公众号
差评我们下次再见

posted on 2025-06-25 22:54  s21  阅读(80)  评论(0)    收藏  举报

导航