摘要: 本文将介绍 Python 层的 quantization 模块。量化是为了减少模型的存储空间和计算量,从而加速模型的推理过程。在量化中,我们将权重和激活值从浮点数转换为整数,从而减少模型的大小和运算的复杂性。通过本文读者将会对量化的基本原理和使用 MegEngine 得到量化模型有所了解。 阅读全文
posted @ 2023-07-31 16:22 MegEngine 阅读(16) 评论(0) 推荐(0) 编辑