2024 年 6月 19 日随笔档案 - deephub

2024年6月19日

摘要： LLMs（大型语言模型）能够记忆并重复它们的训练数据，这可能会带来隐私和版权风险。为了减轻记忆现象，论文作者引入了一种名为"goldfish loss"的微妙修改，在训练过程中，随机抽样的一部分标记被排除在损失计算之外。这些被舍弃的标记不会被模型记忆，从而防止模型完整复制训练集中的一整个标记序列。阅读全文

posted @ 2024-06-19 10:50 deephub 阅读(29) 评论(0) 推荐(0)

deephub

overfit深度学习

公告