摘要: 在这篇文章中,我将展示如何利用 Gradio 的热重载模式快速构建一个功能齐全的 AI 应用。但在进入正题之前,让我们先了解一下什么是重载模式以及 Gradio 为什么要采用自定义的自动重载逻辑。如果您已熟悉 Gradio 并急于开始构建,请直接跳转到第三部分构建文档分析应用。 重载模式具体是做什么 阅读全文
posted @ 2024-04-24 09:57 HuggingFace 阅读(28) 评论(1) 推荐(1) 编辑
摘要: 介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本,现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋,我们也非常高兴地全力支持此次发布,并实现了与 Hugging Face 生态系统的深度集成。 Llama 3 提供两 阅读全文
posted @ 2024-04-23 17:41 HuggingFace 阅读(1220) 评论(0) 推荐(1) 编辑
摘要: 欢迎阅读《Hugging Face Transformers 萌新完全指南》,本指南面向那些意欲了解有关如何使用开源 ML 的基本知识的人群。我们的目标是揭开 Hugging Face Transformers 的神秘面纱及其工作原理,这么做不是为了把读者变成机器学习从业者,而是让为了让读者更好地理 阅读全文
posted @ 2024-04-18 09:25 HuggingFace 阅读(558) 评论(1) 推荐(1) 编辑
摘要: 对应于其强大的能力,大语言模型 (LLM) 需要强大的算力支撑,而个人计算机上很难满足这一需求。因此,我们别无选择,只能将它们部署至由本地或云端托管的性能强大的定制 AI 服务器上。 为何需要将 LLM 推理本地化 如果我们可以在典配个人计算机上运行最先进的开源 LLM 会如何?好处简直太多了: 增 阅读全文
posted @ 2024-04-16 23:46 HuggingFace 阅读(302) 评论(0) 推荐(0) 编辑
摘要: 今天,我们想向大家宣布:“在 Google Cloud 上部署”功能正式上线! 这是 Hugging Face Hub 上的一个新功能,让开发者可以轻松地将数千个基础模型使用 Vertex AI 或 Google Kubernetes Engine (GKE) 部署到 Google Cloud。 M 阅读全文
posted @ 2024-04-12 22:18 HuggingFace 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 我们引入了嵌入量化的概念,并展示了它们对检索速度、内存使用、磁盘空间和成本的影响。我们将讨论理论上和实践中如何对嵌入进行量化,然后介绍一个 演示,展示了 4100 万维基百科文本的真实检索场景。 目录 为什么使用嵌入? 嵌入可能难以扩展 提高可扩展性 二进制量化 Sentence Transform 阅读全文
posted @ 2024-04-12 10:39 HuggingFace 阅读(208) 评论(0) 推荐(1) 编辑
摘要: 量化技术通过用低精度数据类型 (如 8 位整型 (int8)) 来表示深度学习模型的权重和激活,以减少传统深度学习模型使用 32 位浮点 (float32) 表示权重和激活所带来的计算和内存开销。 减少位宽意味着模型的内存占用更低,这对在消费设备上部署大语言模型至关重要。量化技术也使得我们可以针对较 阅读全文
posted @ 2024-04-09 23:47 HuggingFace 阅读(228) 评论(0) 推荐(1) 编辑
摘要: 今天,我们非常兴奋地宣布 部署到 Cloudflare Workers AI 功能正式上线,这是 Hugging Face Hub 平台上的一项新服务,它使得通过 Cloudflare 边缘数据中心部署的先进 GPU、轻松使用开放模型作为无服务器 API 成为可能。 从今天开始,我们将把 Huggi 阅读全文
posted @ 2024-04-08 21:43 HuggingFace 阅读(334) 评论(0) 推荐(2) 编辑
摘要: 嵌入模型在很多场合都有广泛应用,如检索、重排、聚类以及分类。近年来,研究界在嵌入模型领域取得了很大的进展,这些进展大大提高了基于语义的应用的竞争力。BGE、GTE 以及 E5 等模型在 MTEB 基准上长期霸榜,在某些情况下甚至优于私有的嵌入服务。 Hugging Face 模型 hub 提供了多种 阅读全文
posted @ 2024-04-02 19:06 HuggingFace 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 在 NVIDIA DGX Cloud上使用 H100 GPU 轻松训练模型 今天,我们正式宣布推出 DGX 云端训练 (Train on DGX Cloud) 服务,这是 Hugging Face Hub 上针对企业 Hub 组织的全新服务。 通过在 DGX 云端训练,你可以轻松借助 NVIDIA 阅读全文
posted @ 2024-03-21 10:19 HuggingFace 阅读(206) 评论(0) 推荐(0) 编辑