会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
肖祥
博客园
首页
新随笔
联系
订阅
管理
2025年6月10日
SwanLab入门深度学习:Qwen3大模型指令微调
摘要: 一、概述 Qwen3是通义千问团队的开源大语言模型,由阿里云通义实验室研发。以Qwen3作为基座大模型,通过指令微调的方式实现高准确率的文本分类,是学习大语言模型微调的入门任务。 指令微调是一种通过在由(指令,输出)对组成的数据集上进一步训练LLMs的过程。 其中,指令代表模型的人类指令,输出代表遵
阅读全文
posted @ 2025-06-10 15:36 肖祥
阅读(1241)
评论(1)
推荐(1)
公告