会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
nick-algorithmer
博客园
首页
新随笔
联系
订阅
管理
2025年5月12日
DFloat11环境搭建&推理测试
摘要: 引子 很少关注大模型压缩这个领域,碰巧碰上了,那就来吧。为了应对 LLM 不断增长的模型尺寸,通常会采用量化技术,将高精度权重转换为低位表示。这显著减少了内存占用和计算需求,有助于在资源受限的环境中实现更快的推理和部署。然而,量化本质上是一种有损压缩技术,引入了一个基本缺点:它不可避免地改变了 LL
阅读全文
posted @ 2025-05-12 09:10 要养家的程序猿
阅读(77)
评论(0)
推荐(0)
公告