coins30zhl  

《GaussianArt: Unified Modeling of Geometry and Motion for Articulated Objects》收获感悟
提出了一种统一的铰接物体重建方法,通过铰接式3D高斯模型同时建模几何形状与运动。
针对当前主流方法通常将形状重建与运动估计分阶段解耦处理而导致的建模冗余、跨状态物理一致性缺失、以及对多部件复杂铰接结构泛化能力不足的核心问题,本研究创新性地将铰接物体表示为一系列具有部件属性与运动能力的3D高斯基元。这种表示允许每个高斯同时通过软分配权重编码其所属部件,并通过一组全局运动基的加权组合来表征其刚体运动,从而在一个可微分的统一框架内实现几何与运动的协同优化。
优化这一高度参数化的模型,本文设计了一种由软到硬的渐进式训练范式。在软训练阶段,模型通过引入基于部件分割掩码的监督信号和L0梯度稀疏正则化,逐步学习高斯基元的部件隶属关系并初步拟合运动场,以形成合理的部件划分与运动初始化。随后在硬训练阶段,模型将每个高斯基元确定性地分配给权重最高的部件,并视其为一个刚体部分进行简洁高效的运动参数优化,同时利用基于特征匹配的轨迹正则化项来约束运动估计的准确性,从而实现对多部件铰接运动的鲁棒建模。此外,该方法还利用经过针对性微调的视觉基础分割模型(Art-SAM)来生成高质量、多视角一致的部件分割掩码,为整个优化过程提供了稳定可靠的初始化。
为系统评估方法在复杂、多部件场景下的可扩展性与泛化能力,本研究构建并开源了目前规模最大、多样性最高的铰接物体重建基准MPArt-90。该数据集包含来自20个类别的90个物体,部件数量覆盖从2个到20个不等,并提供了完整的真实运动参数标注。大量实验结果表明,GaussianArt在MPArt-90以及PARIS、DigitalTwinArt-PM等多个现有基准测试中,在几何重建精度(如动态部件Chamfer距离显著降低)和运动参数估计准确性(如转轴角度与位置误差)方面均显著超越了ArtGS等现有最佳方法,尤其在处理超过3个部件的物体时优势更为明显。研究进一步展示了将GaussianArt重建出的高保真数字孪生模型无缝集成到NVIDIA Omniverse等机器人仿真环境中,以支持灵巧的物体操控规划,并结合人体姿态模型用于构建逼真的人-场景交互4D场景,验证了其在机器人学与交互式内容创建等下游任务中的实用潜力。尽管该方法在极端运动状态或视角覆盖严重不均的情况下仍存在局限性,但其为构建可扩展、物理一致且支持交互的铰接物体数字孪生提供了一条有效的统一建模路径。

posted on 2026-01-11 12:56  coins30  阅读(3)  评论(0)    收藏  举报