国产 GPU：性能还没追上，起步价格先追上了？

微信视频号：sph0RgSyDYV47z6

快手号：4874645212

抖音号：dy0so323fq2w

小红书号：95619019828

B站1：UID:3546863642871878

B站2：UID: 3546955410049087

学无用的LLM，做自由的灵魂。

先讲个真事

本周，某 AI 初创公司要给 200 人的算法团队补一批卡。

采购小姐姐把需求甩到供应商群里，五分钟后收到四份报价：

• NVIDIA H20：X 万/张

• 某国产 GPU A：X+ H 万/张。供应商说：H的值可能会很高。

小姐姐当场黑人问号：“性能一般，价格反超？我读书少你别骗我。”

把镜头拉回本周的股市

DeepSeek 一句 “UE8M0 FP8 为下一代国产芯片设计”，寒武纪直接涨停。

UE8M0 表示的是一种新的数据格式，特别是用在 AI/深度学习训练/推理或者硬件加速（GPU/TPU/NPU）：

U = Unsigned（无符号）E8 = Exponent 8 bits（8 位指数）M0 = Mantissa 0 bits（0 位尾数，小数部分）

也就是说： UE8M0 代表一种自定义浮点/定点数格式，它使用 8 位指数，没有尾数部分，只能表示指数级的数值范围。

这种数据格式的主要优势是可以节约显存，加速训练和推理。

类比：

FP32（标准 float）= 1 bit 符号 + 8 bit 指数 + 23 bit 尾数
FP16 = 1 bit 符号 + 5 bit 指数 + 10 bit 尾数
UE8M0 = 无符号版本，不存储符号位。

股民狂欢，但采购员想掀桌：

“ 股价涨停，起步价不降一些？ ”

为什么国产卡反而更贵？

据说有如下的原因。

1：量小摊销高

国产 GPU 年出货量 ≈ 万级；NV 年出货量 ≈ 百万级。

研发 20 亿摊到 1 万张卡，单卡研发税 2 万；NV 摊完只要 200 块。

2：先进封装抢产能

国产芯为了追性能，上 2.5D/Chiplet，结果要跟苹果、AMD 抢 TSMC CoWoS 产能，一片 interposer 比 GPU die 还贵。

3：生态税

CUDA 成熟→开发者便宜；国产 SDK 新→客户要求现场蹲点、定制 OP、24h on call。

人力成本直接折算进报价。

于是出现魔幻场面：

“ 性能 80 分，价格 120 分，国产 GPU 成了‘轻奢品’。”

用户/厂家的吐槽

“同样跑一个 Llama-7B，NV 卡 100 ms 出结果，国产卡 180 ms，还多花 H 万，老板以为我贪污。”

我们把销售小哥灌了三杯美式，他酒后吐真言：

“我们也不想卖 25 万，可是晶圆厂、封测厂都按‘优先级’报价，量少就加价；

生态部门天天给我们发邮件，‘又帮客户调了 3 个 OP，成本 +3000’；

老板还指着今年科创板上市，毛利率必须 45% 以上……”

长期主义 or 长期割韭菜？

有些国产厂商把“未来会降价”挂嘴边，但采购小姐姐等不起：

“我 2025 就要扩张，你现在贵 30%，我现金流直接断。”

更惨的是创业公司：

“投资人问我们为什么不支持国产芯，我说支持了就得再融资一轮，他们又不乐意。”

国产GPU如何破局

面对老美对NV GPU的的封锁，这对国产GPU是一次绝好的机会。

需要那些真正想长期做GPU的国内厂商考虑一下如何做大国产GPU的市场，这个时候需要抱团，不要内讧。

目前国内的市场绝对可以养活目前所用认真在做GPU的国内公司。

所以能不能，先把价格降到和NV的价格差不多，或者更便宜一些。

🌈 结语：写在最后

国产 GPU 的故事像极了早年的国产手机：

贵、发热、系统卡，但十年之后，小米把价格打下来，华为把性能做上去。

只是 AI 时代的时间窗口更短，国产 GPU 能不能在性能追上之前，先把价格打下来？

毕竟，股民可以等涨停，程序员等不了模型收敛。

评论区开放：

“如果国产 GPU 真的比 NV 便宜 20%，你会第一时间上车吗？”

留言区见真章。

造国产GPU肯定不像当初造原子弹复杂。国产GPU，希望你能争点气。

微信视频号：sph0RgSyDYV47z6

快手号：4874645212

抖音号：dy0so323fq2w