摘要: 参数量化就是Parameter Quantization。 用更少的bit表示一个value 比如说本来用32位表示一个weight,现在用16位表示一个weight,这样就缩小了一半。 Weight Clustering 根据weight的值对weight进行聚类,每个类中的weight都用同一个 阅读全文
posted @ 2021-05-05 09:54 臭咸鱼 阅读(290) 评论(0) 推荐(0) 编辑