!!!自动化训练。 模型停止点 什么是好模型?。 泛化性改进。 多步没有改善,就毙掉。F1得分 必过集。100%过,
比如打扫,传统大模型无法识别这个指令。 1 蒸馏 采样,给很多query。 让标注人员标注response 合理不合理。 2 拿正确的私域数据注入,行业知识注入