计算机中浮点数的存储

前情提要

今天刷到“飞天闪客”的视频:

让国产芯片一夜暴涨的 UE8M0 是什么东西?

让我想到CSAPP中第三章浮点数的存储,之前很难读,今天看了飞天闪客的视频,想可以镜像研究进行理解了。

通过查看其他资料帮助理解:

Java 浮点数底层存储原理?

浮点数编码原理

ONNX中的8位浮点数(Float8)详解

AI : 万字综述:全面梳理 FP8 训练和推理技术

也问了AI
浮点数在计算机怎么存储"点击查看元宝的回答

我的总结:

关键字:sign 符号位 (S) E(Exponent) 指数 M(Mantissa)尾数

尾数M是小数点后面的数字,一般计算除了结果很长,如果算尽后面用0补全。

计算过程中的关键字:指数偏移值 (Bias)

float8 存储空间为8bit , 常用 E4M3 或者E5M2

float32 存储空间4byte=32bit 常用 E8M23

float64也就是double。 8byte=64bit 常用E11M52

计算规则:-1^S * (1+M) * 2^(E+Bias)

Bias = (2^(E-1))-1 ,比如 float8 为 7 =2^3-1, float32 为127=2^7-1

其他参考视频

浮点数在计算机中如何存储?

posted @ 2025-12-18 10:51  长江~之星  阅读(4)  评论(0)    收藏  举报