随笔档案「2025年6月10日」：SwanLab入门深度学习：Qwen3大模型指令微调 ... - 肖祥

2025年6月10日

摘要：一、概述 Qwen3是通义千问团队的开源大语言模型，由阿里云通义实验室研发。以Qwen3作为基座大模型，通过指令微调的方式实现高准确率的文本分类，是学习大语言模型微调的入门任务。指令微调是一种通过在由（指令，输出）对组成的数据集上进一步训练LLMs的过程。其中，指令代表模型的人类指令，输出代表遵阅读全文

posted @ 2025-06-10 15:36 肖祥阅读(1513) 评论(3) 推荐(1)

肖祥

公告