HuggingFace - 博客园

2025年5月13日

摘要：

这是大模型评估排障指南系列文章的第三篇，敬请关注系列文章: 关于推理关于 \(\LaTeX\) 公式解析关于可复现性假设你读了一篇最近的新模型技术报告，然后心血来潮想要在本机复现他们的结果，却发现根本没法复现，这是为什么？让我们来探讨一下原因。代码库不同要想复现论文或报告的评估得分并阅读全文

posted @ 2025-05-13 17:14 HuggingFace 阅读(574) 评论(0) 推荐(1)

2025年5月8日

大模型评估排障指南 | 关于 LaTeX 公式解析

摘要：

这是大模型评估排障指南系列文章的第二篇，敬请关注系列文章: 关于推理关于 \(\LaTeX\) 公式解析关于可复现性解析 LaTeX 很难。这个问题在评估输出为 \(\LaTeX\) 的模型时经常会遇到，例如 Hugging Face 的数学评估基准。这个基准使用 \(\LaTeX\) 阅读全文

posted @ 2025-05-08 11:50 HuggingFace 阅读(156) 评论(0) 推荐(0)

2025年5月1日

设计即合规: 开放AI生态中的用户数据治理实践

摘要：

Hugging Face Hub 已成为 AI 协作的核心平台，托管了数万个模型、数据集以及交互式应用程序 (Space)。在开放生态系统中，用户知情同意的管理方式与那些更 "数据饥渴" 的科技公司的封闭产品截然不同。本文将通过分析 Hugging Face Hub 平台，探讨由官方主导项目与社区阅读全文

posted @ 2025-05-01 11:52 HuggingFace 阅读(343) 评论(0) 推荐(0)

2025年4月25日

大模型评估排障指南 | 关于推理

摘要：

这是大模型评估排障指南系列文章的第一篇，敬请关注系列文章: 关于推理关于 \(\LaTeX\) 公式解析关于可复现性模型运行非常慢怎么办？调整 batch size 如果你想要评估结果完全可复现 (在特定的输入 prompt 和硬件条件下)，你可以把 batch size 可以设为 1。阅读全文

posted @ 2025-04-25 15:25 HuggingFace 阅读(467) 评论(0) 推荐(1)

2025年4月9日

让 LLM 来评判 | 技巧与提示

摘要：

这是让 LLM 来评判系列文章的第六篇，敬请关注系列文章: 基础概念选择 LLM 评估模型设计你自己的评估 prompt 评估你的评估结果奖励模型相关内容技巧与提示 LLM 评估模型已知偏差及缓解措施: 缺乏内部一致性：同一 prompt 输入评估模型执行多次得到的结果可能不一样 (如果阅读全文

posted @ 2025-04-09 16:01 HuggingFace 阅读(446) 评论(0) 推荐(0)

2025年4月7日

Open R1 项目进展第三期

摘要：

Open R1 项目进展第三期本次更新带来三大突破性进展: CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本，同时包含 C++ 和 Python 双语言解题方案 IOI 基准测试: 基于 2024 国际信息学奥林匹克竞赛 (IOI) 构建的全新挑阅读全文

posted @ 2025-04-07 11:52 HuggingFace 阅读(231) 评论(0) 推荐(0)

2025年4月1日

Open R1 项目进展第二期

摘要：我们启动 Open R1 项目已经两周了，这个项目是为了把 DeepSeek R1 缺失的部分补齐，特别是训练流程和合成数据。这篇文章里，我们很高兴跟大家分享一个大成果: OpenR1-Math-220k，这是我们打造的第一个大规模数学推理数据集！除此之外，我们还聊聊社区里一些让人兴奋的进展，阅读全文

posted @ 2025-04-01 14:12 HuggingFace 阅读(282) 评论(0) 推荐(1)

2025年3月29日

Open R1 项目进展第一期

摘要：

DeepSeek R1 发布已经两周了，而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊: Open-R1 在模仿 DeepSeek-R1 流程和数据方面的进展我们对 DeepSeek-R1 的认识和相关讨论 DeepSeek-R1 发布后社阅读全文

posted @ 2025-03-29 06:42 HuggingFace 阅读(491) 评论(0) 推荐(2)

2025年3月27日

为什么 AI 模型离科学革命还差得很远？

摘要：作者：Thomas Wolf, Hugging Face 联合创始人和首席科学家发布日期：2025 年 2 月 26 日原文链接：🔭 The Einstein AI model 几天前，我在一个活动上分享了一个略显争议的观点，后来我决定把它写下来：我担心人工智能无法带来所谓的“压缩的 21 世阅读全文

posted @ 2025-03-27 19:21 HuggingFace 阅读(153) 评论(0) 推荐(0)

常见的 AI 模型格式

摘要：来源：博客链接过去两年，开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在 Hugging Face 上发布，并被用于实际应用中。然而，开发者在使用这些模型时面临的一个挑战是模型格式的多样性。在本文中，我们将探讨当下常见的 AI 模型格式，包括： GGUF PyTorc 阅读全文

posted @ 2025-03-27 17:40 HuggingFace 阅读(1630) 评论(1) 推荐(3)

Hugging Face 博客

The AI community building the future.

公告