会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
晓飞的算法工程笔记
博客园
首页
新随笔
联系
管理
订阅
2024年10月16日
ERQ:32位转5位仅掉些许精度,来看看两段式后训练量化 | ICML 2024
摘要: 后训练量化(PTQ)在视觉Transformer(ViTs)领域引起了广泛关注,因为它在模型压缩方面表现出了高效率。然而,现有的方法通常忽视了量化权重和激活之间复杂的相互依赖关系,导致了相当大的量化误差。论文提出了一种名为ERQ的两步PTQ方法,精心设计用于顺序降低激活和权重量化带来的量化误差。ER
阅读全文
posted @ 2024-10-16 12:34 晓飞的算法工程笔记
阅读(232)
评论(0)
推荐(0)
公告