Fork me on GitHub
摘要: https://arxiv.org/abs/2503.19551 模型塌缩(Model Collapse): 当新模型越来越多地使用由旧模型生成的数据进行训练,导致数据分布逐步偏离真实世界,从而引发模型能力退化、多样性下降和错误放大的现象。 这篇论文核心是解决大语言模型(比如ChatGPT这类)训练 阅读全文
posted @ 2026-01-08 16:10 stardsd 阅读(49) 评论(0) 推荐(0)