为什么要对LLM进行微调
1.什么是微调
例:将GPT3这样的通用模型,转化成为象ChatGPT这样专门用于聊天的模型
类比:通用模型:家庭医生,微调模型:心脏病专家或皮肤科医生等具有特定的专业能力的医生,可以更深入地处理心脏问题或皮肤问题
2.微调对模型做了什么
①微调使模型能够处理比提示词(prompt)更长的数据,这样模型不仅能访问数据还能从中学习

通用模型:家庭医生 ——> 微调模型:心脏病专家或皮肤科医生
②使模型产生更一致的输出或行为
③微调还可以帮助模型减少幻视(编故事)。


浙公网安备 33010602011771号