fariver

2024年5月30日

[Paper Reading] MOTR: End-to-End Multiple-Object Tracking with Transformer

摘要： MOTR: End-to-End Multiple-Object Tracking with Transformer link 时间：22.07 机构：Megvii TL;DR 传统MOT通过motion与appearance来建模，有复杂的后处理难以E2E。本文基于DETR设计出MOTR算法，通过阅读全文

posted @ 2024-05-30 23:12 fariver 阅读(726) 评论(0) 推荐(0)

2024年5月29日

[Paper Reading] FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin

摘要： FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin link 时间：23.11 机构：houmo.ai 后摩智能 TL;DR 当时比较流行的OCC方案内存与计算复杂度较高，本文提出阅读全文

posted @ 2024-05-29 20:52 fariver 阅读(277) 评论(0) 推荐(0)

2024年5月22日

[Paper Reading] Scene as Occupancy

摘要： Scene as Occupancy link 时间：23.06 机构：Shanghai AI Lab && SenseTime && CUHK TL;DR 提出使用3D Occupancy来表征3D物理场景，相对于3D检测框，3D Occ可提供更细粒度细节。提出OccNet一种多目级连的时序模型，阅读全文

posted @ 2024-05-22 17:17 fariver 阅读(259) 评论(0) 推荐(0)

2024年5月20日

[Paper Reading] BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

摘要： BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers link 时间：22.07 机构：Nanjing University && Sha 阅读全文

posted @ 2024-05-20 21:44 fariver 阅读(326) 评论(0) 推荐(0)

2024年5月15日

[Paper Reading] PETR: Position Embedding Transformation for Multi-View 3D Object Detection

摘要： PETR: Position Embedding Transformation for Multi-View 3D Object Detection PETR: Position Embedding Transformation for Multi-View 3D Object Detection 阅读全文

posted @ 2024-05-15 16:58 fariver 阅读(454) 评论(0) 推荐(0)

2024年5月14日

[Paper Reading] BEVDet: High-Performance Multi-Camera 3D Object Detection in Bird-Eye-View

摘要： BEVDet: High-Performance Multi-Camera 3D Object Detection in Bird-Eye-View BEVDet 时间：21/12 机构：PhiGo(鉴智机器人) TL;DR 一种BEV空间做detection的方法，构建了新颖的数据增强方法以及更新阅读全文

posted @ 2024-05-14 14:12 fariver 阅读(264) 评论(0) 推荐(0)

2024年5月7日

[Paper Reading] OFT Orthographic Feature Transform for Monocular 3D Object Detection

摘要： OFT Orthographic Feature Transform for Monocular 3D Object Detection OFT Orthographic Feature Transform for Monocular 3D Object Detection 时间：18.11 机构：阅读全文

posted @ 2024-05-07 21:22 fariver 阅读(206) 评论(0) 推荐(0)

2024年5月6日

[Paper Reading] LSS: Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D

摘要：名称 Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D 时间：20.08 机构：NVIDIA TL;DR 后融合方法将每一目感知结果通过相机参数转换到BEV空阅读全文

posted @ 2024-05-06 22:58 fariver 阅读(323) 评论(0) 推荐(0)

2024年4月28日

[Paper Reading] DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries

摘要：名称 DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries 时间：21.10 机构：mit/CMU/Stanford TL;DR 一种利用Transformer做E2E的3D目标检测方法，在nuScenes自动阅读全文

posted @ 2024-04-28 14:09 fariver 阅读(167) 评论(0) 推荐(0)

2024年4月22日

[基础] DETR：End-to-End Object Detection with Transformers

摘要：名称 End-to-End Object Detection with Transformers 时间：20.05 机构：Facebook AI TL;DR 文章提出一种称为DETR(Detection Transformer)的基于Transformer的检测器，相比于传统检测器不需要NMS以及a 阅读全文

posted @ 2024-04-22 22:01 fariver 阅读(252) 评论(0) 推荐(0)

公告