上一页 1 2 3 4 5 6 ··· 9 下一页
摘要: SC-Depth系列。 SCDepthV1 之前的单目深度估计网络的重投影损失,更多的是利用前后帧的颜色误差进行约束,得到了比较精确的结果。但它们基本上都有一个共性问题:深度值不连续!连续几张图像之间的深度值不连续!也就是说,在不同的帧上产生尺度不一致的预测,因为它们承受了每帧图像的尺度不确定性。这 阅读全文
posted @ 2024-01-09 13:25 jimchen1218 阅读(466) 评论(1) 推荐(0)
摘要: 本文介绍了一种新的相机-激光雷达融合方法,称为“Lift Attented Splat”,该方法完全绕过单目深度估计,而是使用简单的transformer在BEV中选择和融合相机和激光雷达特征。证据表明,与基于Monocular深度估计的方法相比,本文的方法显示出更好的相机利用率,并提高了物体检测性 阅读全文
posted @ 2024-01-08 16:06 jimchen1218 阅读(176) 评论(0) 推荐(0)
摘要: BEVPerception Survey 最新文献综述研究主要包含三个部分 ——BEV 相机、BEV 激光雷达和 BEV 融合。BEV 相机表示仅有视觉或以视觉为中心的算法,用于从多个周围摄像机进行三维目标检测或分割;BEV 激光雷达描述了点云输入的检测或分割任务;BEV 融合描述了来自多个传感器输 阅读全文
posted @ 2024-01-05 16:40 jimchen1218 阅读(440) 评论(0) 推荐(0)
摘要: 先递上特斯拉的AI 模型HydraNets(2020) 2022年,特斯拉宣布将在其自动驾驶车辆中发布一种全新的算法:Occupancy Networks,主要用来解决以下两个问题: 问题1:检测到的物体不是数据集中训练的对象; 问题2:在基于LiDAR的系统中,可以根据检测到的物体确定对象的存在 阅读全文
posted @ 2024-01-05 15:03 jimchen1218 阅读(251) 评论(0) 推荐(0)
摘要: 1)IoU: 优点:能够准确地描述了预测框和GT框之间的匹配程度 缺点:当两个框的交点为0时,无法准确描述预测框和GT框之间的位置关系 2)GIoU: 优点:引入最小检测框来解决,其中C表示GT框和 Anchor 框之间的最小检测框。 3)DIoU: b和bgt分别表示 Anchor 框的中心点和G 阅读全文
posted @ 2024-01-03 11:20 jimchen1218 阅读(1503) 评论(0) 推荐(0)
摘要: compile_data: 1)初始化Nuscenes API 2)Segmentation Data类,__getitem__得到traindata和valdata,主要调用NuscData的初始化, a.get_scenes调用create_split_scenes得到train,val的场景I 阅读全文
posted @ 2024-01-02 15:25 jimchen1218 阅读(574) 评论(0) 推荐(0)
摘要: 1 def img_transform(img, post_rot, post_tran, 2 resize, resize_dims, crop, 3 flip, rotate): 4 # adjust image 5 img = img.resize(resize_dims) # 变形 crop 阅读全文
posted @ 2024-01-02 13:53 jimchen1218 阅读(188) 评论(0) 推荐(0)
摘要: Nuscenes主要在波士顿和新加坡进行,用于采集的车辆装备了1个旋转雷达(spinning LIDAR),5个远程雷达传感器(long range RADAR sensor)和6个相机(camera) 一、数据集结构:(借用https://zhuanlan.zhihu.com/p/46353705 阅读全文
posted @ 2023-12-27 10:52 jimchen1218 阅读(2575) 评论(0) 推荐(0)
摘要: TensorRT量化工具,支持PTQ和QAT量化 基本流程:读取模型-》转化为IR进行图分析,做一些优化策略 一、TensorRT量化模式 TensorRT有两种量化模式:分别是implicitly以及explicitly量化,前者是隐式量化,在7.0及之前版本用的较多;后者显式量化在8.0版本后才 阅读全文
posted @ 2023-12-23 16:37 jimchen1218 阅读(1717) 评论(0) 推荐(0)
摘要: 自动驾驶:BEV开山之作LSS(lift,splat,shoot)原理代码串讲前言Lift参数创建视锥CamEncodeSplat转换视锥坐标系Voxel Pooling总结 前言 目前在自动驾驶领域,比较火的一类研究方向是基于采集到的环视图像信息,去构建BEV视角下的特征完成自动驾驶感知的相关任务 阅读全文
posted @ 2023-12-21 00:01 jimchen1218 阅读(1579) 评论(0) 推荐(0)
摘要: 一、ChatGPT基础知识 transformer机制 和RLHF 想了解Transformer原理,可参考该链接:transformer原理详解 RLHF(Reinforcement Learning from Human Feedback)是基于人类反馈来构建强化学习,使用强化学习的方法和框架, 阅读全文
posted @ 2023-12-20 14:13 jimchen1218 阅读(58) 评论(0) 推荐(0)
摘要: NMS Python版 def NMS(boxes,scores, thresholds): x1 = boxes[:,0] y1 = boxes[:,1] x2 = boxes[:,2] y2 = boxes[:,3] areas = (x2-x1)*(y2-y1) _,order = score 阅读全文
posted @ 2023-12-20 10:13 jimchen1218 阅读(194) 评论(0) 推荐(0)
摘要: 一、基础篇 1. NMS及其变种 NMS:Non-Maximum Suppression(NMS)非极大值抑制,抑制那些非极大值的元素,保留极大值元素,缺点:1. 需要手动设置阈值,阈值的设置会直接影响重叠目标的检测,太大造成误检,太小达不到理想情况。 2. 低于阈值的直接设置score为0,做法太 阅读全文
posted @ 2023-12-19 23:34 jimchen1218 阅读(110) 评论(0) 推荐(0)
摘要: 近年来,在自动驾驶领域,鸟瞰视角(BEV)空间中的3D目标检测作为一种普遍的方法逐渐脱颖而出。尽管与视角视图方法相比,BEV方法在精度和速度估计方面得到了改进,但将BEV技术部署到实际自动驾驶车辆中仍然具有挑战性。这主要归因于它们依赖于基于视觉 Transformer (ViT)的架构,这使得相对于 阅读全文
posted @ 2023-12-15 11:16 jimchen1218 阅读(555) 评论(0) 推荐(0)
摘要: 1 前言 本文介绍了基于视觉传感器的一些感知算法,包括2D感知,3D感知,多目感知,以及基于注意力机制的感知。其中一些文章里提到了BEV感知,也介绍了其基本原理和近期相关的进展。从目前的发展趋势来看,BEV感知已经成为了一个相对独立的研究课题,在自动驾驶系统中的应用潜力也很大。因此,本专栏专门推出一 阅读全文
posted @ 2023-12-13 16:35 jimchen1218 阅读(1736) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 9 下一页