摘要:
VLA 全称 Vision Language Action(视觉语言动作模型), 广泛用于自动驾驶, 机器人控制等; OpenVLA 是斯坦福开源的 VLA 模型, 由视觉语言模型 Prismatic 演化而来, 最新版本是 OpenVLA-OFT; OpenVLA 对标 Google 的 RT2X 阅读全文
posted @ 2025-09-14 12:03
聆听风琴的巴赫
阅读(117)
评论(0)
推荐(0)

浙公网安备 33010602011771号