摘要: 论文总结 随着 Vision‑Language‑Action (VLA) 模型在 2023‑24 年迅速崛起,研究者发现它们在新机器人平台上常出现 推理延迟高(自回归解码) 和 适配效率低 两大短板。斯坦福团队以自家 7 B 预训练模型 OpenVLA‑7B 为基座,在 Fine‑Tuning Vi 阅读全文
posted @ 2025-07-20 01:25 xbit 阅读(1370) 评论(0) 推荐(1)