深度学习(onnx半精度转换)
将onnx模型参数从fp32转为fp16,可以减少一半模型大小。
import onnx from onnxconverter_common import float16 model = onnx.load("fp32.onnx") model_fp16 = float16.convert_float_to_float16(model) onnx.save(model_fp16, "fp16.onnx")
将onnx模型参数从fp32转为fp16,可以减少一半模型大小。
import onnx from onnxconverter_common import float16 model = onnx.load("fp32.onnx") model_fp16 = float16.convert_float_to_float16(model) onnx.save(model_fp16, "fp16.onnx")