摘要: SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案 🧭 TL;DR 今天,我们介绍了 SmolVLA,这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运行。 仅使用开源社区共享的数据集进行预训练,数据集标签为 lerobot。 SmolVLA-450M 的表现优于许多更 阅读全文
posted @ 2025-06-05 14:32 HuggingFace 阅读(1636) 评论(0) 推荐(1)