为什么要对LLM进行微调

1.什么是微调
例:将GPT3这样的通用模型,转化成为象ChatGPT这样专门用于聊天的模型

类比:通用模型:家庭医生,微调模型:心脏病专家或皮肤科医生等具有特定的专业能力的医生,可以更深入地处理心脏问题或皮肤问题

2.微调对模型做了什么
①微调使模型能够处理比提示词(prompt)更长的数据,这样模型不仅能访问数据还能从中学习

通用模型:家庭医生 ——> 微调模型:心脏病专家或皮肤科医生

②使模型产生更一致的输出或行为

③微调还可以帮助模型减少幻视(编故事)。

来源:https://www.bilibili.com/video/BV1vR6XY7EDd?spm_id_from=333.788.player.switch&vd_source=fbdaf974398573d5fda48df07773ab22&p=3

posted @ 2025-03-27 15:41  起名字太难0123  阅读(26)  评论(0)    收藏  举报