5 月 27 日,半导体行业出现了两个里程碑:美光科技市值突破 1 万亿美元,SK 海力士同步破万亿。同一天,SK 海力士发布了 iHBM(智能高带宽内存)技术——在内存芯片上直接集成控温散热能力。而就在几周前,美光 CEO 公开警告:HBM 内存成本已经占到 AI 芯片组件成本的 2/3。

三件事放在一起,讲的是同一个故事:在 AI 的算力叙事里,存储芯片正在从配角变成主角。

万亿市值:存储的"英伟达时刻"

如果你在 2022 年跟人说"美光会变成万亿美元公司",大多数人会觉得你在讲科幻。那时候美光市值不到 500 亿,存储芯片是一个周期性极强、利润大起大落的苦生意——涨两年跌两年,投资者避之不及。

但 AI 改变了这个剧本。一块 H100 GPU 旁边要贴 6 颗 HBM3e 内存,一颗 B200 要贴 8 颗 HBM3e 12-Hi。GPU 算得再快,数据喂不进去就是废铁。存储带宽成了算力的硬瓶颈,而这个瓶颈的解决方案只有一个:HBM。

于是美光的市值从 500 亿涨到 1 万亿,只用了不到四年。这不是泡沫——每一颗 HBM 背后都对应着一块已经卖出去的 AI 加速卡。订单真实存在,产线全负荷运转,2026 年的 HBM 产能已经被 2027 年的订单预定了。

HBM 吃掉 2/3 成本:算力经济学的重构

美光的警告不是危言耸听。一块 AI 芯片的 BOM(物料清单)成本里,HBM 内存已经占到 60%-70%。GPU 核心芯片本身的成本反而成了小头。

这意味着算力成本的结构被彻底改写了。以前我们说"算力贵"指的是 GPU 贵,但现在 GPU 降价的速度正在被 HBM 涨价的速度吞噬。台积电的先进制程在不断降价,但三星/SK海力士/美光的 HBM 产线没有降价余地——良率已经很极限了,产能就是产能。

对开发者来说,这个信号很现实:云端推理成本短期不会大幅下降。模型公司在喊"token 永久降价",但那是靠工程优化和规模效应在撑。硬件层面的成本曲线是往上走的,不是往下走的。

iHBM:当内存开始"自带散热"

SK 海力士的 iHBM 技术是一个新方向。传统的 HBM 堆叠带来巨大的热量密度——8 层甚至 12 层 DRAM 芯片垂直堆叠在一起,功耗密度比 GPU 核心还高。iHBM 的思路是:在内存封装内部直接集成温控和散热能力,不再依赖外部散热方案。

如果这能规模量产,AI 服务器的散热设计会被简化一个数量级。目前 HBM 的散热要依赖 GPU 基板的热传导,或者额外的液冷方案,复杂且昂贵。iHBM 如果成熟,可能意味着同样的功耗预算下可以堆更多内存、跑更大模型。

存储三巨头:三星掉队了吗?

一个耐人寻味的细节:万亿市值俱乐部里的存储公司是美光和 SK 海力士,三星反而没有出现在头条里。

三星在 HBM 上的进度明显慢了一拍。HBM3e 的验证比 SK 海力士晚了将近一年,HBM4 的时间表也不占优。而 AI 芯片客户(英伟达、AMD、各家自研芯片)对内存的认证周期极长——一旦选定供应商,切换成本极高。先发优势在这个市场里不是加分项,是壁垒项。

一个开发者的判断

存储芯片的万亿时刻,对做技术的人有几个实在的影响:

1. 本地推理的性价比在提升。 如果云端 HBM 成本下不来,本地跑 llama.cpp 的经济性会越来越突出。一块 Mac Studio 的统一内存架构本质上是绕开了 HBM 的瓶颈——它用 LPDDR5 做到了接近 HBM 的带宽,但成本低一个数量级。

2. 模型架构会倒逼内存。 MoE(混合专家)架构流行的一个重要原因就是节省显存——不需要把所有参数都塞进 HBM。如果 HBM 持续涨价,MoE 的优势会进一步放大。未来我们可能看到更多"为内存约束而设计"的模型架构。

3. 关注存内计算。 iHBM 是第一步——在内存封装里加功能。下一步可能是存内计算(Processing-in-Memory)真正落地,让数据不用搬运就能完成矩阵运算。这个方向如果突破,算力格局会再洗一次牌。

2026 年,AI 的瓶颈不在晶体管密度,在数据搬运。谁解决了"喂数据"的问题,谁就掌握了下一张船票。