会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
xwher
博客园
首页
新随笔
联系
订阅
管理
2025年3月23日
llm 量化技术综述
摘要: 综述: LLM 量化 1. Intro 低比特量化主要是减少tensor的bit-width,可以有效减少内存以及计算需求;主要可以压缩权重, 激活值, 和梯度,使得可以在受限资源的设备上使用。 2. 低比特LLM的基础 在这一届,我们主要引入从以下三个方面讨论: low-bit 数值格式 量化粒度
阅读全文
posted @ 2025-03-23 21:02 xwher
阅读(326)
评论(0)
推荐(0)
公告