摘要: 今天,我们想向大家宣布:“在 Google Cloud 上部署”功能正式上线! 这是 Hugging Face Hub 上的一个新功能,让开发者可以轻松地将数千个基础模型使用 Vertex AI 或 Google Kubernetes Engine (GKE) 部署到 Google Cloud。 M 阅读全文
posted @ 2024-04-12 22:18 HuggingFace 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 我们引入了嵌入量化的概念,并展示了它们对检索速度、内存使用、磁盘空间和成本的影响。我们将讨论理论上和实践中如何对嵌入进行量化,然后介绍一个 演示,展示了 4100 万维基百科文本的真实检索场景。 目录 为什么使用嵌入? 嵌入可能难以扩展 提高可扩展性 二进制量化 Sentence Transform 阅读全文
posted @ 2024-04-12 10:39 HuggingFace 阅读(244) 评论(0) 推荐(1) 编辑