摘要: 参考文献:https://cloud.tencent.com/developer/article/2027600 模型量化分为权重量化、激活值量化。将浮点数以定点数的形式表达,达到减少参量、加速运算和减少占用内存的目的。但实际上,只能确定可以减少参量,能不能加速运算要看具体的量化方法和网络结构。 量 阅读全文
posted @ 2023-10-13 10:14 澳大利亚树袋熊 阅读(151) 评论(0) 推荐(0)