摘要:        
onnx中的动态量化和静态量化概念与pytorch中的核心思想一致,但实现工具、流程和具体api有所不同。 onnx量化通常依赖onnxrunntime来执行量化模型,并使用onnx工具库进行模型转换。 除了pytorch量化和onnx量化,实际工作中一般像英伟达、地平线、昇腾等不同的芯片都会有各自    阅读全文
posted @ 2025-07-28 20:58
Dsp Tian
阅读(234)
评论(0)
推荐(0)
        
            
        
        
摘要:        
pytorch中的动态量化和静态量化是两种主要的模型量化技术,旨在通过使用低精度数据类型(如 int8)代替高精度数据类型(如 float32)来减小模型大小并加速推理。 动态量化:在模型运行时(推理时)动态计算激活(activations)的量化参数(scale 和 zero_point)。权重(    阅读全文
posted @ 2025-07-28 20:41
Dsp Tian
阅读(111)
评论(0)
推荐(0)
        
 
                    
                
 浙公网安备 33010602011771号
浙公网安备 33010602011771号