这也许就是DeepSeek V3.1性能提升的关键:UE8M0与INT8量化技术对比与优势分析

DeepSeek在发布其V3.1大语言模型时宣布该模型采用了"UE8M0 FP8 scale data format"进行训练,这一技术细节引发了业界对于新兴量化格式的广泛关注。UE8M0作为FP8格式家族中的一个特殊变体,我们今天来看看这个UE8M0到底是什么。

数值表示格式


我们先看看一般的量化表示,其中E代表指数部分,M代表尾数部分。也就是说M代表了小数部分。

而UE8M0在8位的存储空间中,1位用作符号位,剩余7位全部分配给指数部分,而尾数部分完全省略。这种设计使得UE8M0能够表示的数值范围达到约2^255,远超传统浮点格式。具体而言UE8M0的数值计算公式为:

https://avoid.overfit.cn/post/53cd6b1be3cd461ca0e9b605512164e6

posted @ 2025-08-23 21:17  deephub  阅读(23)  评论(0)    收藏  举报