万亿市值背后的"配角逆袭"——当存储芯片站上 AI 的 C 位

5 月 27 日，半导体行业出现了两个里程碑：美光科技市值突破 1 万亿美元，SK 海力士同步破万亿。同一天，SK 海力士发布了 iHBM（智能高带宽内存）技术——在内存芯片上直接集成控温散热能力。而就在几周前，美光 CEO 公开警告：HBM 内存成本已经占到 AI 芯片组件成本的 2/3。

三件事放在一起，讲的是同一个故事：在 AI 的算力叙事里，存储芯片正在从配角变成主角。

万亿市值：存储的"英伟达时刻"

如果你在 2022 年跟人说"美光会变成万亿美元公司"，大多数人会觉得你在讲科幻。那时候美光市值不到 500 亿，存储芯片是一个周期性极强、利润大起大落的苦生意——涨两年跌两年，投资者避之不及。

但 AI 改变了这个剧本。一块 H100 GPU 旁边要贴 6 颗 HBM3e 内存，一颗 B200 要贴 8 颗 HBM3e 12-Hi。GPU 算得再快，数据喂不进去就是废铁。存储带宽成了算力的硬瓶颈，而这个瓶颈的解决方案只有一个：HBM。

于是美光的市值从 500 亿涨到 1 万亿，只用了不到四年。这不是泡沫——每一颗 HBM 背后都对应着一块已经卖出去的 AI 加速卡。订单真实存在，产线全负荷运转，2026 年的 HBM 产能已经被 2027 年的订单预定了。

美光的警告不是危言耸听。一块 AI 芯片的 BOM（物料清单）成本里，HBM 内存已经占到 60%-70%。GPU 核心芯片本身的成本反而成了小头。

这意味着算力成本的结构被彻底改写了。以前我们说"算力贵"指的是 GPU 贵，但现在 GPU 降价的速度正在被 HBM 涨价的速度吞噬。台积电的先进制程在不断降价，但三星/SK海力士/美光的 HBM 产线没有降价余地——良率已经很极限了，产能就是产能。

对开发者来说，这个信号很现实：云端推理成本短期不会大幅下降。模型公司在喊"token 永久降价"，但那是靠工程优化和规模效应在撑。硬件层面的成本曲线是往上走的，不是往下走的。

SK 海力士的 iHBM 技术是一个新方向。传统的 HBM 堆叠带来巨大的热量密度——8 层甚至 12 层 DRAM 芯片垂直堆叠在一起，功耗密度比 GPU 核心还高。iHBM 的思路是：在内存封装内部直接集成温控和散热能力，不再依赖外部散热方案。

如果这能规模量产，AI 服务器的散热设计会被简化一个数量级。目前 HBM 的散热要依赖 GPU 基板的热传导，或者额外的液冷方案，复杂且昂贵。iHBM 如果成熟，可能意味着同样的功耗预算下可以堆更多内存、跑更大模型。

一个耐人寻味的细节：万亿市值俱乐部里的存储公司是美光和 SK 海力士，三星反而没有出现在头条里。

三星在 HBM 上的进度明显慢了一拍。HBM3e 的验证比 SK 海力士晚了将近一年，HBM4 的时间表也不占优。而 AI 芯片客户（英伟达、AMD、各家自研芯片）对内存的认证周期极长——一旦选定供应商，切换成本极高。先发优势在这个市场里不是加分项，是壁垒项。

存储芯片的万亿时刻，对做技术的人有几个实在的影响：

1. 本地推理的性价比在提升。 如果云端 HBM 成本下不来，本地跑 llama.cpp 的经济性会越来越突出。一块 Mac Studio 的统一内存架构本质上是绕开了 HBM 的瓶颈——它用 LPDDR5 做到了接近 HBM 的带宽，但成本低一个数量级。

2. 模型架构会倒逼内存。 MoE（混合专家）架构流行的一个重要原因就是节省显存——不需要把所有参数都塞进 HBM。如果 HBM 持续涨价，MoE 的优势会进一步放大。未来我们可能看到更多"为内存约束而设计"的模型架构。

3. 关注存内计算。 iHBM 是第一步——在内存封装里加功能。下一步可能是存内计算（Processing-in-Memory）真正落地，让数据不用搬运就能完成矩阵运算。这个方向如果突破，算力格局会再洗一次牌。

2026 年，AI 的瓶颈不在晶体管密度，在数据搬运。谁解决了"喂数据"的问题，谁就掌握了下一张船票。

posted on 2026-06-13 12:53 0xfisher 阅读(11) 评论(0) 收藏举报

刷新页面返回顶部