随笔分类 -  Hugging Face 博客

摘要:我们很高兴地宣布,我们正在与 Wiz 合作,目标是提高我们平台和整个 AI/ML 生态系统的安全性。 Wiz 研究人员 与 Hugging Face 就我们平台的安全性进行合作并分享了他们的发现。 Wiz 是一家云安全公司,帮助客户以安全的方式构建和维护软件。 随着这项研究的发布,我们将借此机会重点 阅读全文
posted @ 2024-05-14 21:39 HuggingFace 阅读(217) 评论(0) 推荐(1)
摘要:介绍 我们很高兴分享“万事通”(Jack of All Trades,简称 JAT) 项目,该项目旨在朝着通用智能体的方向发展。该项目最初是作为对 Gato (Reed 等,2022 年) 工作的公开复现启动的,Gato 提出训练一种能够执行视觉与语言以及决策任务的 Transformer。于是我们 阅读全文
posted @ 2024-05-13 22:57 HuggingFace 阅读(349) 评论(0) 推荐(1)
摘要:StarCoder2-Instruct: 完全透明和可自我对齐的代码生成指令微调 是一种技术,它能让大语言模型 (LLMs) 更好地理解和遵循人类的指令。但是,在编程任务中,大多数模型的微调都是基于人类编写的指令 (这需要很高的成本) 或者是由大型专有 LLMs 生成的指令 (可能不允许使用)。 我们推出了一个叫做 StarCoder2-15B-Instruct-v0. 阅读全文
posted @ 2024-05-11 09:01 HuggingFace 阅读(394) 评论(0) 推荐(0)
摘要:Ryght 在 Hugging Face 专家助力下赋能医疗保健和生命科学之旅本文是 Ryght 团队的客座博文。 Ryght 是何方神圣? Ryght 的使命是构建一个专为医疗保健和生命科学领域量身定制的企业级生成式人工智能平台。最近,公司正式公开了 Ryght 预览版 平台。 当前,生命科学公司不断地从各种不同来源 (实验室数据、电子病历、基因组学、保险索赔、药学、临床等 阅读全文
posted @ 2024-05-07 22:46 HuggingFace 阅读(258) 评论(0) 推荐(2)
摘要:在英特尔至强 CPU 上使用 🤗 Optimum Intel 实现超快 SetFit 推理在缺少标注数据场景,SetFit 是解决的建模问题的一个有前途的解决方案,其由 Hugging Face 与 Intel 实验室 以及 UKP Lab 合作共同开发。作为一个高效的框架,SetFit 可用于对 Sentence Transformers 模型进行少样本微调。 SetFit 仅需很少的 阅读全文
posted @ 2024-05-06 21:41 HuggingFace 阅读(426) 评论(0) 推荐(2)
摘要:开源医疗大模型排行榜: 健康领域大模型基准测试多年来,大型语言模型 (LLMs) 已经发展成为一项具有巨大潜力,能够彻底改变医疗行业各个方面的开创性技术。这些模型,如 GPT-3,GPT-4 和 Med-PaLM 2,在理解和生成类人文本方面表现出了卓越的能力,使它们成为处理复杂医疗任务和改善病人护理的宝贵工具。它们在多种医疗应用中显示出巨大的 阅读全文
posted @ 2024-04-30 23:30 HuggingFace 阅读(1686) 评论(0) 推荐(1)
摘要:视觉语言模型可以同时从图像和文本中学习,因此可用于视觉问答、图像描述等多种任务。本文,我们将带大家一览视觉语言模型领域: 作个概述、了解其工作原理、搞清楚如何找到真命天“模”、如何对其进行推理以及如何使用最新版的 trl 轻松对其进行微调。 什么是视觉语言模型? 视觉语言模型是可以同时从图像和文本中 阅读全文
posted @ 2024-04-29 23:55 HuggingFace 阅读(1848) 评论(0) 推荐(0)
摘要:在这篇文章中,我将展示如何利用 Gradio 的热重载模式快速构建一个功能齐全的 AI 应用。但在进入正题之前,让我们先了解一下什么是重载模式以及 Gradio 为什么要采用自定义的自动重载逻辑。如果您已熟悉 Gradio 并急于开始构建,请直接跳转到第三部分构建文档分析应用。 重载模式具体是做什么 阅读全文
posted @ 2024-04-24 09:57 HuggingFace 阅读(745) 评论(1) 推荐(1)
摘要:介绍 Meta 公司的 Llama 3 是开放获取的 Llama 系列的最新版本,现已在 Hugging Face 平台发布。看到 Meta 持续致力于开放 AI 领域的发展令人振奋,我们也非常高兴地全力支持此次发布,并实现了与 Hugging Face 生态系统的深度集成。 Llama 3 提供两 阅读全文
posted @ 2024-04-23 17:41 HuggingFace 阅读(2701) 评论(0) 推荐(1)
摘要:欢迎阅读《Hugging Face Transformers 萌新完全指南》,本指南面向那些意欲了解有关如何使用开源 ML 的基本知识的人群。我们的目标是揭开 Hugging Face Transformers 的神秘面纱及其工作原理,这么做不是为了把读者变成机器学习从业者,而是让为了让读者更好地理 阅读全文
posted @ 2024-04-18 09:25 HuggingFace 阅读(7175) 评论(3) 推荐(2)
摘要:对应于其强大的能力,大语言模型 (LLM) 需要强大的算力支撑,而个人计算机上很难满足这一需求。因此,我们别无选择,只能将它们部署至由本地或云端托管的性能强大的定制 AI 服务器上。 为何需要将 LLM 推理本地化 如果我们可以在典配个人计算机上运行最先进的开源 LLM 会如何?好处简直太多了: 增 阅读全文
posted @ 2024-04-16 23:45 HuggingFace 阅读(570) 评论(0) 推荐(0)
摘要:今天,我们想向大家宣布:“在 Google Cloud 上部署”功能正式上线! 这是 Hugging Face Hub 上的一个新功能,让开发者可以轻松地将数千个基础模型使用 Vertex AI 或 Google Kubernetes Engine (GKE) 部署到 Google Cloud。 M 阅读全文
posted @ 2024-04-12 22:18 HuggingFace 阅读(643) 评论(0) 推荐(0)
摘要:我们引入了嵌入量化的概念,并展示了它们对检索速度、内存使用、磁盘空间和成本的影响。我们将讨论理论上和实践中如何对嵌入进行量化,然后介绍一个 演示,展示了 4100 万维基百科文本的真实检索场景。 目录 为什么使用嵌入? 嵌入可能难以扩展 提高可扩展性 二进制量化 Sentence Transform 阅读全文
posted @ 2024-04-12 10:38 HuggingFace 阅读(1100) 评论(0) 推荐(1)
摘要:量化技术通过用低精度数据类型 (如 8 位整型 (int8)) 来表示深度学习模型的权重和激活,以减少传统深度学习模型使用 32 位浮点 (float32) 表示权重和激活所带来的计算和内存开销。 减少位宽意味着模型的内存占用更低,这对在消费设备上部署大语言模型至关重要。量化技术也使得我们可以针对较 阅读全文
posted @ 2024-04-09 23:47 HuggingFace 阅读(1621) 评论(0) 推荐(1)
摘要:嵌入模型在很多场合都有广泛应用,如检索、重排、聚类以及分类。近年来,研究界在嵌入模型领域取得了很大的进展,这些进展大大提高了基于语义的应用的竞争力。BGE、GTE 以及 E5 等模型在 MTEB 基准上长期霸榜,在某些情况下甚至优于私有的嵌入服务。 Hugging Face 模型 hub 提供了多种 阅读全文
posted @ 2024-04-02 19:05 HuggingFace 阅读(473) 评论(0) 推荐(0)
摘要:在 NVIDIA DGX Cloud上使用 H100 GPU 轻松训练模型 今天,我们正式宣布推出 DGX 云端训练 (Train on DGX Cloud) 服务,这是 Hugging Face Hub 上针对企业 Hub 组织的全新服务。 通过在 DGX 云端训练,你可以轻松借助 NVIDIA 阅读全文
posted @ 2024-03-21 10:19 HuggingFace 阅读(441) 评论(0) 推荐(0)
摘要:最近,Argilla 和 Hugging Face 共同 推出 了 Data is Better Together 计划,旨在凝聚社区力量协力构建一个对提示进行排名的偏好数据集。仅用几天,我们就吸引了: 350 个社区贡献者参与数据标注 超过 11,000 个提示评分 你可通过 进度面板 了解最新的 阅读全文
posted @ 2024-03-20 09:58 HuggingFace 阅读(315) 评论(0) 推荐(1)
摘要:对文本转语音 (text-to-speech, TTS) 模型的质量进行自动度量非常困难。虽然评估声音的自然度和语调变化对人类来说是一项微不足道的任务,但对人工智能来说要困难得多。为了推进这一领域的发展,我们很高兴推出 TTS 擂台。其灵感来自于 LMSys 为 LLM 提供的 Chatbot 擂台 阅读全文
posted @ 2024-03-16 13:14 HuggingFace 阅读(565) 评论(1) 推荐(2)
摘要:随着生成式人工智能 (Generative AI,GenAI) 革命的全面推进,使用 Llama 2 等开源 transformer 模型生成文本已成为新风尚。人工智能爱好者及开发人员正在寻求利用此类模型的生成能力来赋能不同的场景及应用。本文展示了如何基于 Optimum Habana 以及我们实现 阅读全文
posted @ 2024-03-13 23:41 HuggingFace 阅读(255) 评论(0) 推荐(1)
摘要:近来,LLM 已深入人心,大有燎原之势。但在我们将其应用于千行百业之前,理解其在不同场景下的安全性和潜在风险显得尤为重要。为此,美国白宫发布了关于安全、可靠、可信的人工智能的行政命令; 欧盟人工智能法案也对高风险人工智能系统的设立了专门的强制性要求。在这样的大背景下,我们首先需要确立一个用于定量评估 阅读全文
posted @ 2024-03-12 22:35 HuggingFace 阅读(488) 评论(0) 推荐(1)