NeurIPS 2025Mamba引爆3D重建!MVSMamba:效率与精度双双超越Transformer


论文标题:MVSMamba: Multi-View Stereo with State Space Model
作者团队:北京科技大学
发布时间:2025年11月4日
✅Lab4AI平台提供AI导读和AI翻译等工具,辅助论文阅读。
⭐研究背景
基于学习的多视图立体视觉方法严重依赖鲁棒的特征匹配。传统CNN方法因感受野有限,难以捕捉全局特征;而Transformer虽能建模长程依赖,但其二次计算复杂度严重制约了性能与效率的平衡。如何在保持高精度的同时降低计算开销,成为当前MVS领域的关键挑战。
⭐研究目标
本研究旨在解决Transformer在MVS中计算复杂度过高的问题。核心目标是提出一种基于Mamba(状态空间模型)的全新MVS网络MVSMamba,实现高效的全局特征聚合。通过引入动态扫描策略,构建全方位、多尺度的特征表示,在提升性能的同时显著降低计算成本。
⭐研究方法
论文提出MVSMamba网络,核心是动态Mamba模块。该模块采用参考视图中心的动态扫描策略,将源特征与参考特征在四个方向拼接,通过Mamba块进行线性复杂度的序列建模,实现高效的视图内与视图间全局交互。该方法在特征金字塔网络中进行多尺度特征聚合,并以由粗到细的方式估计深度。
⭐研究结果
在DTU和Tanks-and-Temples基准测试上,MVSMamba达到了最先进的性能。特别是在DTU数据集上,其综合排名和效率均优于现有CNN和Transformer方法。消融实验验证了动态扫描、多尺度聚合等关键设计的有效性,证明了该方法在保持极低内存和运行时开销的同时,实现了优异的重建精度和泛化能力。

浙公网安备 33010602011771号