会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
又有知识…增加了
个人笔记,数学和计算机相关知识
博客园
首页
新随笔
联系
订阅
管理
2025年10月27日
大模型微调(六):宪法AI
摘要: 这里有一个营销倾向!“混合专家MoE”听起来确实比“我们有一堆前馈网络,并根据输入路由到不同的网络”酷多了。 宪法AI也有点像这样,一个更直白的花哨名字。它的基本原理是:不让模型在RLHF中评估输出,而是先让模型根据一套原则,也就是“宪法”,来批判和修改自己的回答。 比如,让模型生成一个回答,然后问
阅读全文
posted @ 2025-10-27 08:11 CathyBryant
阅读(9)
评论(0)
推荐(0)
公告