摘要: VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning. arXiv:2502.00931. 上图是VL-Nav的效果图。VL-Nav是“具备空间推理能力”、“零样本的”、“轻量级的”视觉语言导航方法,方法特色为:图像的 阅读全文
posted @ 2025-04-15 21:55 pen9u1nlee 阅读(298) 评论(0) 推荐(0)