李飞飞最新访谈:空间智能是AI的下一个前沿,Transformer可能被淘汰?

李飞飞最新访谈:空间智能是AI的下一个前沿,Transformer可能被淘汰?

斯坦福大学教授李飞飞在播客中分享了对AI未来的大胆预测,强调空间智能将重塑游戏规则。

2025年11月,斯坦福大学教授、World Labs创始人李飞飞参加了一档播客访谈,深入探讨了空间智能(Spatial Intelligence)和世界模型(World Models)的核心意义。

她指出,当前的大型语言模型(LLM)虽令人惊叹,但仅靠文本无法实现通用人工智能(AGI),AI必须像人类一样通过视觉和行动体验物理世界。

AGI的关键缺口:语言之外的“空间智能”

在大型语言模型(LLMs)席卷全球的今天,李飞飞却指出了一个核心局限:“人类大量智能无法被语言捕捉”。无论是空间推理、急救反应,还是DNA双螺旋结构的推导,这些超越语言的能力恰恰是AGI的关键拼图。

她强调,人类的学习本质是具身化的——我们在没有语言的情况下与世界互动,感知光线、触觉、重力和空间关系。而当前AI仅靠文本数据学习,就像“只通过说明书了解世界”。因此,AI必须走出文本的牢笼,获得空间智能:建立起看、做和想象之间的完整闭环,像生物一样深度感知空间。

这并非李飞飞的全新探索,而是她数十年计算机视觉研究的自然延伸。从图像理解到具身智能,再到如今的空间智能,她的核心诉求始终一致:让AI从“读取世界”升级为“体验世界”。

World Labs的Marble模型:实现3D一致性

WorldLabs推出的首款产品Marble,彻底打破了传统视频生成模型的瓶颈。其最大亮点在于“物体恒常性”——在生成的3D空间中,当你转身再回头,背后的物体依然存在且保持原状,而非像梦境般随机变形。

支撑这一突破的是实时帧模型(RTFM),其核心目标是构建“几何一致、时间持久的数字容器”。与普通生成模型不同:

它是深度多模态的:支持文本、图像、视频甚至粗略3D布局作为输入;

算力效率惊人:仅需单张H100GPU即可实现高效3D空间推理;

兼顾双重表征:模型内部包含隐式表征,输出层则显式生成3D内容,既满足技术深度又贴合实际应用。

李飞飞透露,Marble的设计初衷是赋能人类创作者。无论是游戏开发、视觉特效、建筑设计,还是机器人仿真(数字孪生),这些依赖3D技术的行业将告别繁琐的工具操作,普通人也能瞬间构建复杂的3D交互世界。

与杨立昆“和而不同”

李飞飞与前Meta首席科学家杨立昆在世界模型构建上常被对比。杨立昆主张学习世界的抽象“隐式表征”,而李飞飞的Marble则输出显式3D表征。但她表示,两者并非对立,隐式与显式表征最终需融合。目前World Labs选择显式输出,旨在服务游戏开发、建筑设计等领域的创作者。

AI还不懂物理,缺一个视觉版“NextToken”

尽管生成式AI能模拟水流、树木摆动等物理现象,但李飞飞戳破了关键真相:“这些效果源于统计规律的模仿,而非对物理定律的因果理解”。当前AI可以通过数据拟合出运动定律,却无法达到相对论级别的高级抽象——这正是Transformer架构的局限所在。

更核心的难题在于视觉领域的“通用任务函数缺失”。语言模型有完美的“预测下一个Token”作为目标,但视觉领域的“预测下一帧”存在先天缺陷:它将3D世界压缩为2D,丢失了关键结构信息。有人认为3D重建可作为目标函数,但李飞飞反驳:“老虎无需精确3D重建,依然是强大的空间智能体”。

这一未解之谜,也成为空间智能研究的核心挑战:找到能媲美“NextToken预测”的视觉通用任务,让AI从统计相关性跨越到因果逻辑。

五年之约:新架构将诞生,“多重宇宙”照进现实

对于技术演进,李飞飞给出了明确预判:“五年内,AI在理解物理世界方面将取得重大突破,Transformer不会是AI的最终架构”。她认为,要实现相对论级别的抽象能力,行业必须在基础架构和算法上迎来新突破。

而这一突破将催生“多重宇宙”的落地:通过降低3D生成门槛,人类可创建无数数字平行世界,重塑教育、娱乐和科学探索。她设想未来的“神经空间引擎”将结合物理引擎的确定性与AI的创造力,使普通人也能瞬间构建交互世界。

从“看见”到“创造”,AI的下一个十年

从计算机视觉先驱到空间智能拓荒者,李飞飞的探索始终围绕一个核心:让AI真正“理解”世界。Marble的诞生只是第一步,未来的AI将实现“感知-推理-创造”的闭环,既懂物理规律,又能落地实用价值。

当Transformer架构成为历史,当空间智能打通虚拟与现实,人类与AI的关系将迎来全新定义——不再是工具的使用者,而是数字世界的共建者。正如李飞飞所言:“这是21世纪最迷人的科学探索,既要破解智能的奥秘,也要为人类制造真正有用的工具”。

这场关于空间智能的革命,已经拉开序幕。

Lab4AI.cn提供实验平台,提供一站式科研工具链!
👉一键直达

posted @ 2025-12-02 14:57  Lab4AI大模型实验室  阅读(0)  评论(0)    收藏  举报