文本生成幻觉问题

文本生成的事实性增强

文章通过实验研究了解码算法的选择对生成的真实性的影响。
代表性算法：贪婪解码和核采样（top-p）。
核采样解决了贪婪解码的退化问题（重复），具有更好的多样性和更少的重复，但在真实性上不如贪婪解码。但贪婪解码的质量和多样性不好。

提出了一种真实性核采样解码策略，在生成质量和真实性之间实现了更好的权衡。

基于一种假设：生成句子的后半部分时，抽样的随机性比在句子开头时更有害于事实。

句子的开头没有前面的文本，所以生成任何内容都是安全的。然而，随着生成的进行，前提变得更加确定，更少的单词选择可以使句子成为事实。

引入一种事实核采样算法，在句子生成过程中动态调整“核”p。在每个句子中生成的第i个token的核概率\(p_{t} = max(w,p \times \lambda^{t-1})\)。
其中\(\lambda\)是top-p概率的衰减因子，\(w\)是概率衰减的下界。

给定top-p采样池，在每个生成步骤中用λ逐渐衰减p，随着时间减少随机性
经过长时间的生成，p迅速衰减到一个小值。因此在每个句子开头（句号之后）重新将p置为默认值
引入一个下界w限制p衰减到太小，无法等效于贪婪解码

确保句子后半段的正确性对真实性更关键。因此构建一个句子完成损失，使得更专注预测句子的后部分。

为每个句子确定一个枢轴t，对t之前的token预测损失应用零掩码。这个枢轴只在训练时需要，推理时不需要。

实验证明，t = 0.5 × sentence_length就可以了

posted @ 2024-01-30 11:47 ︶ㄣ演戲ㄣ阅读(61) 评论(0) 收藏举报

刷新页面返回顶部