AWQ量化

https://zhuanlan.zhihu.com/p/697761176

AWQ量化

 

AWQ(激活感知权重量化)通过分析模型在校准数据上的激活值分布,识别显著权重并进行量化,从而优化模型性能。

AWQ的基本原理

AWQ量化技术的核心在于识别模型中不同权重的重要性,尤其是显著权重(salient weights)。这些权重对模型的输出精度影响较大,因此在量化过程中需要特别保护。AWQ通过以下步骤来实现这一目标:
  1.  
    5 来源

量化过程

AWQ的量化过程可以概括为以下几个步骤:
posted @ 2026-01-21 14:22  blcblc  阅读(2)  评论(0)    收藏  举报