背景
2022年11月30日由OpenAI推出首个对话版本 ChatGPT
2024年5月6日 Hugging Face 的le-robot
2024年12月26日 DeepSeek V3 发布
2025年1月20日 DeepSeek-R1模型发布 腊月二十一
机器
Atlas(波士顿动力)
2019年特斯拉Optimus原型机
宇树科技 Unitree H1 / G1 智元机器人 远征A1
模型
01.谷歌
RT-1
2022年12月16日谷歌推出的Robotics Transformer 1 (简称RT-1)是一种多任务模型
RT-2
2023年7月28日 谷歌DeepMind于推出的新一代人工智能学习模型 Robotics Transformer 2(RT-2)
RT-X
2023年10月发布了RT-2和
02.Physical Intelligence(简称 PI 或 π)
Physical Intelligence Physical Intelligence(简称 PI)是一家成立于 2024 年 2 月
2024年10月,发布了Pi0 。
Pi0 是一个 Vision-Language-Action (VLA) 模型,采用了 Multi-Expert (多专家) 混合架构
2025年4月:PI发布了具身智能VLA模型π0.5
2025年11月,PI发布了具身智能VLA模型π0.6
03.英伟达
2024年3月宣布推出 GR00T 项目,这是一个面向人形机器人的通用基础模型
2025年3月19日推 GR00T N1
2025年5月20日人形机器人基础模型 Isaac GR00T N1.5 新版
https://research.nvidia.com/labs/gear/gr00t-n1_5/
2025年12月15日 GR00T N1.6
04.千寻智能-千寻 Spirit v1.5模型是
2026年1月12日开源的具身智能VLA基础模型 Spirit v1.
05.阿里-蚂蚁集团 LingBot-VLA
2026年1月28日,蚂蚁集团旗下灵波科技宣布开源其具身大模型 LingBot-VLA及全链路工具链
数据和工具链
| 数据集名称 |
发布主体 |
发布时间 |
数据来源 |
| Open X-Embodiment |
谷歌 |
2023年10月 |
仿真、开源整合、真实数采 |
| LeRobot Dataset |
Hugging Face |
2024年05月 |
|
| GR00T-X-Embodiment |
英伟达 |
2025年03月 |
真实世界、合成数据和网络数据 |
| ARIO 数据集 |
鹏城实验室 |
2024年03月 |
|
| AgiBot World |
智元 |
2024年12月 |
真实数采 |
| G1_MountCameraRedGripper_Dataset |
宇树 |
2025年03月 |
真实数采 |
工具链
数据仿真
参考
https://github.com/huggingface/lerobot