魔芯科技发布全新世界模型：国产算力驱动，开启空间智能新纪元

2025年12月18日，浙大系创业公司魔芯科技在华为（杭州）全球培训中心正式发布自研交互式视频世界模型。这是国内首个基于全国产算力实现数分钟级、全高清实时交互的世界模型，标志着中国在空间智能领域迈入世界第一梯队。

从3D打印到空间智能：魔芯科技的战略转型

魔芯科技创始人陈天润在发布会上表示，公司基于过去在消费级3D打印和三维物体生成领域的深厚技术积累，现已全面转型空间智能与世界模型的研发。当前的成果是我们向通用人工智能迈出的关键一步，它能让AI真正理解、推理并创造三维世界。

据悉，魔芯科技近期已完成由知名产业机构领投的数亿元融资，资金将用于魔芯科技的空间智能算法的持续研发与商业化落地。

国产算力全栈支撑：华为昇腾910C铸就硬核实力

魔芯科技的KOKONI-World的诞生完全依托国产信创算力体系。魔芯科技与华为昇腾云深度合作，基于华为昇腾910C芯片构建的Matrix384超节点集群完成模型训练与推理。

昇腾910C的大显存优势使KOKONI-World实现了长达2000帧（约2分钟）的超长世界记忆，用户在场景中探索后返回原点，所有物体的空间关系依然保持高度一致。同时，昇腾910C的高通讯带宽特性支撑模型在1080p全高清分辨率下实现实时响应，生成流畅无卡顿的视频流。此外，KOKONI-World支持完整的6自由度（6-DoF）精确相机控制，用户可通过键盘鼠标精准操控视角，实现游戏级的沉浸式交互体验。

核心技术创新

KOKONI-World的卓越性能背后，是魔芯科技在底层算法上的多项原创突破：

精细坐标相机控制：KOKONI-World引入基于坐标的精细化相机控制方案，将物理相机参数（包括旋转矩阵、位置向量、焦距等）转换为紧凑的pixel-aligned几何表示，实现了对虚拟相机运动的像素级精确控制。

相机感知记忆结构：模型创新性地将历史视觉信息与相机位姿进行联合编码，构建了一套"相机感知"的长时域记忆系统。该系统能够根据当前视角智能检索相关的历史场景信息，确保用户在大范围探索后返回时，场景的几何结构与视觉细节保持高度一致。

多Prompt渐进式注入：基于多卡的硬件特点，精心设计了多Prompt渐进注入分片后模型的机制，实现实时根据用户想法触发新的内容生成的功能。

级联式知识蒸馏：为实现实时推理，魔芯科技采用多阶段级联蒸馏方案，将复杂的多步去噪过程压缩为少步采样，配合端侧的小模型，实现实时1080p分辨率的内容输出。

行业领先：多维度超越现有方案

相较于业界现有的世界模型方案，KOKONI-World在多个关键维度上实现了显著突破。在记忆时长方面，KOKONI-World可维持长达2分钟的场景一致性，远超Google Genie-3的60秒和腾讯混元WorldPlay的20秒，为用户提供了真正意义上的"无限探索"体验。在视觉质量上，KOKONI-World率先实现1080p全高清输出，而多数竞品仍停留在720p甚至更低分辨率。在交互精度上，KOKONI-World的6-DoF精确相机控制能力，使其动作响应准确度显著优于同类产品，用户的每一个操作指令都能得到精准、符合物理直觉的视觉反馈。

更为重要的是，KOKONI-World是目前唯一一款完全基于国产算力实现训练与推理的世界模型，从芯片到框架实现全栈自主可控，为我国在这一战略性技术领域的自主发展树立了重要标杆。

展望未来

KOKONI-World的发布，是国产AI算力与前沿模型创新深度协同的里程碑。魔芯科技表示，将持续深耕空间智能领域，携手华为昇腾生态，为自动驾驶、机器人、游戏娱乐、影视制作等行业提供世界级的三维智能解决方案，共同开启智能时代新篇章。

posted @ 2026-01-26 10:28 速递信息阅读(0) 评论(0) 收藏举报

刷新页面返回顶部

博客资讯

魔芯科技发布全新世界模型：国产算力驱动，开启空间智能新纪元

公告