会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
zrq96
博客园
首页
新随笔
联系
订阅
管理
2025年8月24日
大模型量化加速
摘要: 最近在研究大模型压缩的各种流派和好用的方法,然后发现模型稀疏分解、剪枝、蒸馏这些虽然学界研究得很多,但实际上效果都比不上量化。因此在这里整理一下对于大模型量化的一些基础。 概念 所谓模型量化,简单来说就是用更低位宽格式来表示模型的权重参数。 在我们学习C或Java的编程入门的时候,我们学过浮点数的表
阅读全文
posted @ 2025-08-24 01:13 zrq96
阅读(201)
评论(0)
推荐(0)