06 2025 档案

摘要:presence_penalty: 对于1个token,如果它出现在生成的文本中,则施加惩罚 \[\hat{\rm logits}_i={\rm logits}_i - {\rm presence\_penalty} * \mathbb{I}({\rm frequency}_i>0) \] 鼓励模型 阅读全文
posted @ 2025-06-05 22:05 片刻的自由 阅读(90) 评论(0) 推荐(0)