会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
liujunxi
博客园
首页
新随笔
联系
订阅
管理
2025年9月26日
大模型剪枝流程总结
摘要: 在一个预训练好的大模型中,通常会有一部分权重,他在大部分的问答中都是处于低激活,甚至几乎不激活的状态,这显然会浪费一部分显存和算力,在模型每次加载和传递的过程中。 为此,我们采用了大模型剪枝的方法,核心组件有两个,钩子(Hooks)和一套我们自己定义的目标剪枝(Targeted Pruning)策略
阅读全文
posted @ 2025-09-26 15:53 liujunxi
阅读(83)
评论(0)
推荐(0)
公告