魔芯科技发布全新世界模型:国产算力驱动,开启空间智能新纪元

2025年12月18日,浙大系创业公司魔芯科技在华为(杭州)全球培训中心正式发布自研交互式视频世界模型。这是国内首个基于全国产算力实现数分钟级、全高清实时交互的世界模型,标志着中国在空间智能领域迈入世界第一梯队。

 

从3D打印到空间智能:魔芯科技的战略转型

魔芯科技创始人陈天润在发布会上表示,公司基于过去在消费级3D打印和三维物体生成领域的深厚技术积累,现已全面转型空间智能与世界模型的研发。当前的成果是我们向通用人工智能迈出的关键一步,它能让AI真正理解、推理并创造三维世界。

 

据悉,魔芯科技近期已完成由知名产业机构领投的数亿元融资,资金将用于魔芯科技的空间智能算法的持续研发与商业化落地。

 

国产算力全栈支撑:华为昇腾910C铸就硬核实力

魔芯科技的KOKONI-World的诞生完全依托国产信创算力体系。魔芯科技与华为昇腾云深度合作,基于华为昇腾910C芯片构建的Matrix384超节点集群完成模型训练与推理。

 

昇腾910C的大显存优势使KOKONI-World实现了长达2000帧(约2分钟)的超长世界记忆,用户在场景中探索后返回原点,所有物体的空间关系依然保持高度一致。同时,昇腾910C的高通讯带宽特性支撑模型在1080p全高清分辨率下实现实时响应,生成流畅无卡顿的视频流。此外,KOKONI-World支持完整的6自由度(6-DoF)精确相机控制,用户可通过键盘鼠标精准操控视角,实现游戏级的沉浸式交互体验。

 

核心技术创新

KOKONI-World的卓越性能背后,是魔芯科技在底层算法上的多项原创突破:

 

精细坐标相机控制:KOKONI-World引入基于坐标的精细化相机控制方案,将物理相机参数(包括旋转矩阵、位置向量、焦距等)转换为紧凑的pixel-aligned几何表示,实现了对虚拟相机运动的像素级精确控制。

相机感知记忆结构:模型创新性地将历史视觉信息与相机位姿进行联合编码,构建了一套"相机感知"的长时域记忆系统。该系统能够根据当前视角智能检索相关的历史场景信息,确保用户在大范围探索后返回时,场景的几何结构与视觉细节保持高度一致。

多Prompt渐进式注入基于多卡的硬件特点,精心设计了多Prompt渐进注入分片后模型的机制,实现实时根据用户想法触发新的内容生成的功能。

级联式知识蒸馏:为实现实时推理,魔芯科技采用多阶段级联蒸馏方案,将复杂的多步去噪过程压缩为少步采样,配合端侧的小模型,实现实时1080p分辨率的内容输出。

 

行业领先:多维度超越现有方案

相较于业界现有的世界模型方案,KOKONI-World在多个关键维度上实现了显著突破。在记忆时长方面,KOKONI-World可维持长达2分钟的场景一致性,远超Google Genie-3的60秒和腾讯混元WorldPlay的20秒,为用户提供了真正意义上的"无限探索"体验。在视觉质量上,KOKONI-World率先实现1080p全高清输出,而多数竞品仍停留在720p甚至更低分辨率。在交互精度上,KOKONI-World的6-DoF精确相机控制能力,使其动作响应准确度显著优于同类产品,用户的每一个操作指令都能得到精准、符合物理直觉的视觉反馈。

 

更为重要的是,KOKONI-World是目前唯一一款完全基于国产算力实现训练与推理的世界模型,从芯片到框架实现全栈自主可控,为我国在这一战略性技术领域的自主发展树立了重要标杆。

 

展望未来

KOKONI-World的发布,是国产AI算力与前沿模型创新深度协同的里程碑。魔芯科技表示,将持续深耕空间智能领域,携手华为昇腾生态,为自动驾驶、机器人、游戏娱乐、影视制作等行业提供世界级的三维智能解决方案,共同开启智能时代新篇章。

posted @ 2026-01-26 10:28  速递信息  阅读(0)  评论(0)    收藏  举报