会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
chirp
博客园
首页
新随笔
联系
订阅
管理
2024年7月16日
学习微调大语言模型 LLM 时的碎碎念
摘要: 要完全解决幻觉问题,就要让模型的推理有足够的上下文,而不是凭空编造。这一点需要从训练时就要做到。就是说,例如 role play 的微调,若角色的回复包含了某种状态(天气如何、吃没吃饭等),这些状态不应该是凭空出现的,而是已经出现在上文。我的设想是,模型应当会主动索求状态的说明文字,若没有,也应该主
阅读全文
posted @ 2024-07-16 17:56 倒地
阅读(61)
评论(0)
推荐(0)
公告