会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Stanlei
博客园
首页
新随笔
联系
订阅
管理
2024年3月26日
大模型参数高效微调技术原理综述
摘要: 0 微调概述 大模型参数高效微调技术原理综述 两个目标 微调:从过去到现在 微调:单模态和多模态有没有区别 0.1 高效参数微调 以BERT模型为代表,预训练语言模型+下游任务上进行全量微调,但以GPT3为代表的预训练语言模型(PLM)参数规模变得越来越大,这使得在消费级硬件上进行全量微调变得不可行
阅读全文
posted @ 2024-03-26 15:55 Stanlei
阅读(2629)
评论(0)
推荐(0)
公告
// 侧边栏目录 // https://blog-static.cnblogs.com/files/douzujun/marvin.nav.my1502.css // //
// //
// //