摘要:
GAIA-1: A Generative World Model for Autonomous Driving GAIA-1 时间:23.09 机构:Wayve TL;DR 本文介绍一种生成世界模型,该模型利用视频、文本和动作输入来生成逼真的驾驶场景,同时提供对自身车辆行为和场景特征的细粒度控制。 阅读全文
摘要:
FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin link 时间:23.11 机构:houmo.ai 后摩智能 TL;DR 当时比较流行的OCC方案内存与计算复杂度较高,本文提出 阅读全文
摘要:
Scene as Occupancy link 时间:23.06 机构:Shanghai AI Lab && SenseTime && CUHK TL;DR 提出使用3D Occupancy来表征3D物理场景,相对于3D检测框,3D Occ可提供更细粒度细节。提出OccNet一种多目级连的时序模型, 阅读全文
摘要:
BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers link 时间:22.07 机构:Nanjing University && Sha 阅读全文
摘要:
PETR: Position Embedding Transformation for Multi-View 3D Object Detection PETR: Position Embedding Transformation for Multi-View 3D Object Detection 阅读全文
摘要:
OFT Orthographic Feature Transform for Monocular 3D Object Detection OFT Orthographic Feature Transform for Monocular 3D Object Detection 时间:18.11 机构: 阅读全文