会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
跟着Michael学架构
博客园
首页
新随笔
联系
订阅
管理
2025年3月13日
什么是大模型的量化和蒸馏
摘要: Quantization (量化) & Knowledge Distillation(蒸馏) Ollama:量化技术 量化是一种将模型中的浮点数参数(如32位浮点数)转换为低精度数值(如8位整数)的技术。通过减少数值的精度,可以显著减少模型的计算复杂度和存储需求。 量化类型: 1.权重量化:仅对模型
阅读全文
posted @ 2025-03-13 12:45 Michael_Z
阅读(700)
评论(0)
推荐(0)
公告