Incremental Network Quantization Towards Lossless CNNs with Low-Precision Weights
概
本文提出了一种增量式的量化方法, 能够逐步地将模型参数一点点地量化.
主要思想

-
本文思想很简单, 比如给定一个完整的预训练好的模型:
- 挑选 50% 量化, 剩下 50% re-training 以恢复结果;
- 接着从剩下的 50% 中挑选 50% 量化, 剩下 25% re-training 以恢复结果;
- 直到最终完全量化.
-
这里挑选的策略用的是 pruning-inspired parition, 即每次将绝对值比较小的权重优先挑出来量化.
-
量化策略, 选择的是 power-of-two.

浙公网安备 33010602011771号