谈谈华为昇腾910C性能

在AI芯片的战场上,每一款新品的发布都牵动着全球科技界的神经。尤其当这款芯片来自中国,且身处备受瞩目的华为,其意义便更加非凡。近期,华为昇腾910C AI加速器的量产消息,无疑如同在平静水面投下巨石,激起层层涟漪。这颗被誉为“中国最强AI芯片”的面世,不仅是对华为技术实力的又一次证明,更是中国在高科技领域不屈前行的缩影。
本文将基于海外分析师 Lennart Heim 的专业拆解,抽丝剥茧,深度剖析昇腾910C背后的技术构成、性能表现与战略意义,力求还原其在全球AI芯片竞争格局中的真实分量。
昇腾910C的技术构成:精巧的“双芯合璧”, 架构设计耐人寻味
并非全新架构,而是巧妙的“老将新用”?
昇腾910C的“C”,或许并非意味着一次架构上的“Critical Change”,反而更像是一次站在巨人肩膀上的“Clever Combination”。 从技术本质上来看,它并非横空出世的全新架构,而更像是一场精巧的“合体术”——将两颗已有的昇腾910B芯片,通过先进的封装技术巧妙地整合在一起。
这背后的意味值得玩味。在先进制程受限的当下,与其耗费巨资强攻未知领域,不如退一步,在成熟制程上挖掘潜力,通过架构创新和巧妙设计实现性能跃升,这或许才是更务实且高效的路径。 昇腾910C 的出现,恰恰印证了这种策略的可能性。
然而,值得我们特别关注的是,根据 Lennart Heim 的分析,这批 910C 芯片的 “出生地” 可能并非完全在我们自主可控的产线上,而是指向了一个略显敏感的来源——台积电。 Heim 的观点颇具冲击力: 这批芯片,很有可能是在更早之前,在出口管制尚未收紧之时,华为通过多方渠道储备而来。 换句话说,我们今天看到的 910C,或许是华为在西方技术封锁前,就已提前布下的 “棋子”。
如果 Heim 的推论成立,那么昇腾 910C 的象征意义就更加复杂和耐人寻味了。它不仅仅代表了华为在AI芯片领域的最新进展,更像是一枚时代印记,记录着特定历史时期下,中国科技企业在全球化浪潮中,如何巧妙周旋,积蓄力量的独特路径。
 
 
添加图片注释,不超过 140 字(可选)
封装方案的“取舍之道”:性能与成本的平衡术
谈及芯片封装,这并非只是简单的 “组装” 工艺,而是直接关乎芯片性能、功耗乃至最终成本的关键环节。特别是在AI芯片领域,先进封装技术的重要性愈发凸显。NVIDIA 之所以能在高性能AI芯片领域独占鳌头,其在先进封装技术上的持续投入与领先优势功不可没。
然而,昇腾 910C 在封装方案的选择上,却展现出一种耐人寻味的 “务实主义”。 它并没有激进地追逐最前沿的封装技术,而是选择了相对成熟,技术难度更低的方案: 将两颗独立的 910B 芯片分别放置在各自的硅中介层上,再通过有机基板将两个硅中介层连接起来。
 
 
网图:昇腾910B 假想拆解图
这样的方案,在 Lennart Heim 看来,相比 NVIDIA 动辄 CoWoS 或 Foveros 等先进封装方案,确实显得 “逊色” 一些。 差距主要体现在芯片间的互联带宽上。 Heim 预计,昇腾 910C 采用的封装方式,可能会导致芯片间带宽比 NVIDIA 的先进方案低上 10-20 倍
 
 
网图:昇腾910B 架构猜想图
带宽的降低,直接影响的是芯片间数据交换的效率,进而可能限制整体性能的发挥。 这无疑是一个不小的技术 “短板”。 然而,我们也要看到这种 “取舍” 背后的考量。 更成熟的封装方案,往往意味着更低的成本,更高的良率,以及更快的量产速度。 在当下这个特殊的时期,保证稳定量产,快速形成战斗力,或许比单纯追求极致性能更为重要。
更何况,架构的不足,可以软件来弥补。 Heim 也敏锐地指出, 昇腾 910C 的架构特点,势必会对使用这款芯片的工程师提出更高的要求。软件优化将会成为释放 910C 潜力的关键所在。 如何通过巧妙的软件工程,最大程度地弥补硬件架构上的 “带宽瓶颈”,将成为昇腾 910C 能否在实际应用中真正发挥价值的关键。 这就好比在一场赛跑中,虽然起跑线稍稍落后,但只要策略得当,后程发力,依然有机会反超。
 
 
添加图片注释,不超过 140 字(可选)
性能与技术参数:与H100的“实力差距”及“追赶之势”
客观评估: 性能参数的“80%之说”
性能,永远是衡量芯片价值的最核心指标。 Lennart Heim 对昇腾 910C 的性能给出了较为细致的预估。 整体来看, 910C 的性能放在当下,依然称得上是 “实力派”, 但若与 NVIDIA 的标杆产品对标,差距依然客观存在。
在关键的 FP16 精度算力上, Heim 预计 910C 大约能达到 800 TFLOPS 左右。 内存带宽则预估在 3.2 TB/s 左右。 这样的数据,与 NVIDIA 2022 年推出的明星产品 H100 相比, Heim 认为, 910C 的性能大概能达到 H100 的 80%。 这是一个相对 “保守” 但也颇为中肯的评估。
换句话说, 如果 H100 是一位 “满分选手”, 那么 910C 大约能拿到 80 分, 依然属于 “优良” 的等级, 绝非 “不堪一击”。 但我们也要清醒地认识到,这 20% 的差距,在日新月异的AI芯片领域,已经代表着不小的代差。
更值得关注的是芯片的 “逻辑面积”。 Heim 指出, 昇腾 910C 的芯片逻辑面积,竟然比 H100 大约大了 60%! 这意味着, 在相同的性能水平下, 910C 需要消耗更多的硅片面积, 这在一定程度上反映了 910C 在架构效率和设计优化方面, 与 H100 依然存在差距。 “块头更大,力气略逊”, 这或许是对 910C 与 H100 性能对比的一个形象写照。
 
 
添加图片注释,不超过 140 字(可选)
代际差距:面对B200,挑战升级
如果说与 H100 相比, 昇腾 910C 尚有 “一战之力” 的话, 那么面对 NVIDIA 今年即将全面铺向数据中心的 B200 系列, 技术差距就显得更为明显了。
Heim 毫不讳言地指出, 与 B200 相比, 昇腾 910C 在各个关键性能指标上, 都存在着较为明显的代差:
  • 计算性能: 约落后 3 倍!
  • 内存带宽: 约落后 2.5 倍!( Heim 的分析中假设 910C 使用了 HBM2E 内存, 当然, 华为如果真的 “弹药充足”, 采用更高规格的 HBM3 也并非不可能, 但即便如此,要追平 2.5 倍的带宽差距,依然难度巨大。)
  • 能效比: 更是与 NVIDIA 最新的 B200 产品拉开了明显差距。
这意味着, 如果说 910C 在 2022 年还能勉强站在 H100 的 “影子” 下, 那么到了 2025 年, 面对性能全面升级的 B200, 910C 的竞争力无疑将进一步被削弱。 技术代际的鸿沟, 客观存在, 不容回避。
 
 
添加图片注释,不超过 140 字(可选)
供应链与生产:扑朔迷离的“来源之谜”与自主可控的“本土猜想”
“台积电暗度陈仓”? 令人震惊的供应链推论
芯片供应链,向来是科技领域最敏感,也最受关注的环节之一。 特别是对于华为这样身处 “风暴眼” 的企业, 其芯片的来源, 更是牵动着无数人的神经。 Lennart Heim 在供应链分析上的判断,可谓 “语出惊人”, 甚至有些 “石破天惊” 的意味。
Heim 大胆推测, 华为之所以能够在当下这个时间点, 推出昇腾 910C 这样一款高性能 AI 芯片, 背后很可能得益于早期通过 “非正规渠道”, 从台积电囤积了高达 300 万颗 基于 7nm 工艺的昇腾芯片裸片 (dies)!
300 万颗! 这是一个令人咋舌的数字。 如果 Heim 的推论属实, 那么这无疑是一场 “暗度陈仓” 式的豪赌。 在出口管制收紧之前, 华为就已预判到未来的风险, 并提前布局, 大量囤积关键芯片, 为未来的发展争取了宝贵的时间和战略空间。
不仅如此, Heim 还推测, 华为可能还从三星电子手中囤积了足够多的 HBM2E 高带宽内存。 如果将芯片裸片和 HBM 内存这两个关键要素结合起来, Heim 认为, 华为理论上可以生产出约 140 万个 910C 加速器
140 万个 910C! 这意味着什么? 如果全部部署到位, 按照 Heim 对 910C 单卡算力的估算, 140 万个 910C 所能提供的 AI 算力, 将相当于 100 万片 NVIDIA H100 级别的 AI 算力
这是一个足以改变游戏规则的数字。 如果华为真的拥有如此规模的 “隐藏算力”, 那么它在全球 AI 竞争格局中的地位, 无疑将被重新评估。
 
 
添加图片注释,不超过 140 字(可选)
“国产7nm 曙光”? 自主生产能力的“犹抱琵琶半遮面”
当然, 在供应链来源的 “谜团” 之外, 还有一个更受中国科技界关注的问题: 昇腾 910C 能否实现 “国产化” 生产? 或者说, 华为是否已经掌握了在本土产线上, 自主生产 7nm 甚至更先进制程芯片的能力?
对于这个问题, Lennart Heim 的观点相对谨慎, 也更贴近现实的 “灰色地带”。 他认为, 华为 “应该” 具备在 7nm 节点上生产 910B 和 910C 芯片裸片的能力。 这 “应该” 二字, 意味深长, 既肯定了华为在技术研发上的实力积累, 也暗示了 “实际量产” 可能还面临诸多挑战和不确定性。
Heim 坦言, 迄今为止, 他尚未看到 “确凿无疑” 的证据, 例如权威机构的拆解报告, 能够完全证实市面上流通的 910B 或 910C 芯片, 是 “Made in China” 。 因此, 他倾向于认为, 目前市面上绝大多数的 910C 芯片, “很可能” 仍然来自于 “非正规渠道” 获得的台积电产品。
但 Heim 也并没有完全排除 “国产自产” 的可能性。 他认为, 国内生产 7nm 芯片, “理论上是可能的”。 只是, 大规模量产的良率、 成本、 稳定性等问题, 可能仍然是制约 “国产 910C” 大规模问世的障碍。
这种 “既有希望, 又有挑战” 的判断, 或许更符合中国半导体产业的真实写照。 我们在先进制程工艺上, 确实取得了一定的突破, 但距离完全实现 “自主可控”、“规模量产”, 依然还有一段路要走。 昇腾 910C 的供应链 “来源之谜”, 也恰恰折射出中国科技产业, 在自主创新道路上 “摸着石头过河” 的复杂性和艰巨性。
 
 
添加图片注释,不超过 140 字(可选)
战略意义与全球AI竞争: 算力差距下的“差异化竞争”与“后发优势”
算力差距“客观存在”, 战略意义“不容低估”
尽管 昇腾 910C 的性能和供应链来源, 依然存在诸多 “谜团” 和争议, 但其战略意义, 却是不容忽视的。 Lennart Heim 从全球 AI 竞争格局的高度, 对 910C 的战略价值, 给出了深刻的解读。
首先, Heim 坦言, 与西方最顶尖的 AI 芯片相比, 昇腾 910C 依然存在 “差距”。 这种差距, 不仅仅体现在单卡性能上, 更体现在整体的算力规模上。 Heim 预测, 到 2025 年底, 西方阵营生产的 AI 芯片数量, 将至少是中国的 5 倍 以上! 而整体的计算能力差距, 甚至可能达到 10-20 倍! 美国的 AI 算力优势, 依然是压倒性的。
这是我们需要正视的 “硬实力” 差距。 但 Heim 的分析, 并没有停留在简单的 “数字对比” 上, 而是进一步深入到 “算力资源分配” 的战略层面。 他敏锐地指出, 仅仅拥有 10 倍的计算能力, 固然是巨大的战略优势, 但如果这些算力资源, 分散在成百上千家不同的公司手中, 其战略威力, 就会大打折扣。
而中国, 则可能在 “资源集中” 方面, 展现出独特的优势。 Heim 认为, 中国可能比西方国家, “更容易实现资源集中”。 这或许才是中国 AI 战略真正的 “王牌” 所在。
集中力量办大事, 这是中国在诸多领域屡试不爽的 “制胜法宝”。 在 AI 算力这个 “新基建” 领域, 如果中国能够充分发挥 “资源集中” 的优势, 将有限的算力资源, 优先投入到最关键、 最核心的战略方向上, 那么即使整体算力规模落后于西方, 依然有机会在局部领域, 甚至在某些关键技术方向上, 实现 “弯道超车”。
 
 
添加图片注释,不超过 140 字(可选)
“推理先行,应用突围”? 差异化竞争的“中国路径”展望
“集中优势算力, 实现差异化竞争”, 这或许是中国 AI 战略的 “破局之道”。 那么, 具体应该如何 “差异化” 竞争? Lennart Heim 也给出了他的 “中国路径” 展望。
Heim 认为, 中国在 AI 领域, 依然 “具有竞争力”。 尤其是在 AI 推理能力 方面, 中国 “可能会有更多进步”。 “推理”, 正是 AI 应用落地的关键环节。 相比于 “烧钱” 的 “预训练”, “推理” 的成本更低, 更贴近实际应用场景, 也更容易产生商业价值。
或许, 中国可以扬长避短, 将有限的算力资源, 更多地投入到 AI 推理芯片和推理平台的研发和部署上, 在 AI 应用的 “最后一公里” 上发力, 率先在 特定行业、 特定场景 实现 AI 应用的规模化落地。
例如, 在智能城市、 智能交通、 智能制造、 安防监控等领域, 中国已经积累了大量的数据和应用场景优势。 如果能够将 910C 等国产 AI 芯片, 与这些应用场景深度融合, 打造出一批 “杀手锏” 级别的 AI 应用, 那么即使在 “通用 AI 大模型” 的预训练方面, 暂时落后于西方, 依然可以在 AI 应用的商业化落地和产业化进程中, 占据领先地位。
然而, Heim 也提醒我们, “差异化竞争” 并非 “一劳永逸” 的 “万能药”。 他指出, 下一代 AI 预训练, 可能需要 “新的、 更大的集群, 需要数万片芯片”。 而且, 要真正发挥 AI 模型的价值, 还需要将它们 “部署给数百万用户, 或自主运行大量 AI 智能体”。 此时, “总计算量仍然很重要”。
“水桶的容量, 取决于最短的那块木板”。 算力规模的短板, 最终依然会限制 中国 AI 发展的 “天花板”。 因此, 在 “差异化竞争” 的同时, 中国也必须持续加大在 AI 基础设施建设和先进制程工艺研发上的投入, 努力补齐 “算力短板”, 才能在全球 AI 竞争中, 赢得更大的战略主动权。
 
 
添加图片注释,不超过 140 字(可选)
总结与展望: 不完美但弥足珍贵, 差异化突围的“中国式AI道路”
“80% 性能” 的背后: 战略意义远超参数本身
综合 Lennart Heim 的深度分析, 我们可以对华为昇腾 910C 形成一个更客观、 也更立体的认识:
从单卡性能来看, 910C 或许并不 “惊艳” —— 仅相当于 H100 的 80% 左右, 且发布时间也晚了 4 年。 如果仅仅以 “参数论英雄”, 910C 似乎并无太多 “亮点”。
但如果我们跳出 “参数” 的束缚, 站在更高的战略维度审视 910C, 就会发现, 它的意义远不止于 “80% 性能” 本身。 在西方技术封锁日益收紧的背景下, 华为能够推出 910C 这样一款高性能 AI 芯片, 本身就具有极强的象征意义。 它证明了, 即使在 “逆境” 之中, 中国科技企业依然没有放弃对技术高峰的攀登, 依然在努力缩小与世界顶尖水平的差距。
更何况, 如果 Heim 关于 “台积电芯片囤积” 的推论成立, 那么 910C 的战略价值就更加凸显了。 通过 “非正规渠道” 获得的大量芯片裸片, 再加上可能从中芯国际获得的少量 “国产 910C”, 华为完全可以通过 “集群更多芯片” 的方式, 来弥补单卡性能的差距, 构建起规模可观的 AI 算力集群。
“单丝不成线, 独木不成林”。 在 AI 时代, 算力集群的规模效应, 往往比单卡性能的 “极致参数” 更为重要。 从这个意义上来说, 昇腾 910C 的 “价值”, 绝不能仅仅用 “80% 性能” 来简单衡量。 它更像是华为, 乃至中国 AI 产业, 在重重围堵之下, 巧妙利用成熟技术、 积极开拓多元化供应链、 并最终走出一条 “差异化突围” 之路的 一个 “里程碑” 式的注脚。
 
 
添加图片注释,不超过 140 字(可选)
“出口管制” 并非“失效”, “AI弹性”与“防御AI” 或成未来关键词
Lennart Heim 在文章的最后, 也对西方的 “出口管制” 政策, 进行了反思和展望。 他认为, 昇腾 910C 的出现, “并不意味着出口管制失败”。 关键是要 “理解中国能够提供什么, 出口管制允许什么, 以及它们不允许什么”。
这句话, 耐人寻味, 也意味深长。 “出口管制”, 固然在一定程度上限制了中国 AI 产业的发展速度, 但却无法完全阻止中国 AI 前进的步伐。 中国依然可以通过 “自主创新”、 “多元化供应链”、 “差异化竞争” 等多种方式, 在 AI 领域 “突围”。 “出口管制” 的 “篱笆墙”, 或许可以延缓中国 AI 追赶的速度, 但却无法 “扼杀” 中国 AI 发展的内生动力。
Heim 还预告, 他将在未来撰文, 详细阐述 “AI 弹性”、“用于防御的 AI” 等 “补充方法”。 这或许暗示着, 在 “出口管制” 常态化的背景下, 中国 AI 发展战略, 需要更加注重 “自主可控”, 构建更具韧性的 AI 产业链, 并积极探索 “防御性 AI” 技术, 以应对未来可能面临的 “技术脱钩” 风险。
“宜未雨而绸缪, 毋临渴而掘井”。 面对风云变幻的国际局势, 中国 AI 产业的发展, 既要保持 “战略自信”, 也要增强 “忧患意识”。 在 “自主创新” 的道路上, 我们既要脚踏实地, 埋头苦干, 也要仰望星空, 前瞻布局, 才能在全球 AI 竞争的 “下半场”, 赢得更加主动, 也更有尊严。
 
 
添加图片注释,不超过 140 字(可选)
结语
华为昇腾910C的问世,绝非一帆风顺的 “王者归来”,而更像是一场在重压之下,展现韧性与智慧的 “突围之战”。 它或许并不完美,单卡性能与顶尖水平仍有差距,供应链来源也扑朔迷离,但它的战略意义却不容低估。它标志着中国在AI芯片自主研发的道路上,又迈出了关键一步,也预示着在全球AI竞争格局中,中国将走出一条 “差异化竞争” 的独特路径。
昇腾910C 的 “故事”, 远未结束。 我们将持续关注它的实际应用表现, 以及它对中国 AI 产业带来的深远影响, 并为读者带来更多深入、 专业的解读与分析。 中国 AI, 未来可期, 但前路漫漫, 仍需上下求索。
 
参考文献链接
posted @ 2025-05-24 05:44  吴建明wujianming  阅读(1463)  评论(0)    收藏  举报