文本生成幻觉问题
文本生成的事实性增强

解码策略
文章通过实验研究了解码算法的选择对生成的真实性的影响。
代表性算法:贪婪解码和核采样(top-p)。
核采样解决了贪婪解码的退化问题(重复),具有更好的多样性和更少的重复,但在真实性上不如贪婪解码。但贪婪解码的质量和多样性不好。
提出了一种真实性核采样解码策略,在生成质量和真实性之间实现了更好的权衡。
基于一种假设:生成句子的后半部分时,抽样的随机性比在句子开头时更有害于事实。
句子的开头没有前面的文本,所以生成任何内容都是安全的。然而,随着生成的进行,前提变得更加确定,更少的单词选择可以使句子成为事实。
引入一种事实核采样算法,在句子生成过程中动态调整“核”p。在每个句子中生成的第i个token的核概率\(p_{t} = max(w,p \times \lambda^{t-1})\)。
其中\(\lambda\)是top-p概率的衰减因子,\(w\)是概率衰减的下界。
给定top-p采样池,在每个生成步骤中用λ逐渐衰减p,随着时间减少随机性
经过长时间的生成,p迅速衰减到一个小值。因此在每个句子开头(句号之后)重新将p置为默认值
引入一个下界w限制p衰减到太小,无法等效于贪婪解码
训练
确保句子后半段的正确性对真实性更关键。因此构建一个句子完成损失,使得更专注预测句子的后部分。
为每个句子确定一个枢轴t,对t之前的token预测损失应用零掩码。这个枢轴只在训练时需要,推理时不需要。
实验证明,t = 0.5 × sentence_length就可以了
浙公网安备 33010602011771号