摘要: Codex 正在推动开源 AI 模型的训练与发布 继我们使用 Claude Code 训练开源模型的项目之后,现在我们更进一步,将 Codex 引入这一流程。这里的重点不是“Codex 自己开源模型”,而是让 Codex 作为编码代理,参与并自动化开源模型的训练、评估与发布全流程。为此,我们为 Codex 接入了 Hugging Face Skil 阅读全文
posted @ 2025-12-22 16:06 HuggingFace 阅读(5) 评论(0) 推荐(0)
摘要: 经同意的语音克隆 在这篇博客文章中,我们介绍了“语音同意验证机制 (voice consent gate)”的概念,支持通过明确同意来进行语音克隆。我们还提供了一个 示例 Space 应用 和 相关代码,帮助大家快速上手这一想法。 近年来,逼真的语音生成技术已经达到了令人惊讶的水平。在某些情况下,生成出来的合成语音几 阅读全文
posted @ 2025-12-22 15:58 HuggingFace 阅读(6) 评论(0) 推荐(0)
摘要: 流式数据集:效率提升 100 倍! 快速了解(TLDR) 现在只需一行代码,就能通过 load_dataset('dataset', streaming=True) 以流式方式加载数据集,无需下载! 无需复杂配置、不占磁盘空间、不再担心 “磁盘已满” 或 429 请求过多错误,立即开始训练 TB 级数据集! 性能非常强劲:在 64×H 阅读全文
posted @ 2025-12-22 15:17 HuggingFace 阅读(84) 评论(0) 推荐(0)