摘要: 这里有一个营销倾向!“混合专家MoE”听起来确实比“我们有一堆前馈网络,并根据输入路由到不同的网络”酷多了。 宪法AI也有点像这样,一个更直白的花哨名字。它的基本原理是:不让模型在RLHF中评估输出,而是先让模型根据一套原则,也就是“宪法”,来批判和修改自己的回答。 比如,让模型生成一个回答,然后问 阅读全文
posted @ 2025-10-27 08:11 CathyBryant 阅读(9) 评论(0) 推荐(0)