深度学习(onnx半精度转换)

将onnx模型参数从fp32转为fp16,可以减少一半模型大小。

import onnx
from onnxconverter_common import float16

model = onnx.load("fp32.onnx")
model_fp16 = float16.convert_float_to_float16(model)
onnx.save(model_fp16, "fp16.onnx")
posted @ 2025-01-25 15:36  Dsp Tian  阅读(315)  评论(0)    收藏  举报