摘要: DataFlow 是一个数据准备系统,旨在从噪声数据源(PDF、纯文本、低质量问答)中解析,生成,加工并评估高质量数据,以提升大语言模型(LLMs)在特定领域的表现,支持预训练、监督微调(SFT)、强化学习训练以及基于知识库的 RAG 系统。 https://github.com/OpenDCAI/ 阅读全文
posted @ 2026-01-28 19:59 Smalltalk 阅读(11) 评论(0) 推荐(0)