【大模型】常见的向量数据库

一、开源分布式(企业级 / 生产首选)

1. Milvus(Zilliz)

  • 定位:工业级、云原生、PB 级分布式向量库,国内 RAG 生产最常用。
  • 特点:CNCF 毕业项目;支持 HNSW/IVF/FLAT 等索引;GPU 加速;存算分离、弹性扩缩容;多模态支持好。
  • 规模:十亿~百亿级向量,高并发 QPS。
  • 适用:企业 RAG、推荐、图像检索、金融风控。

2. Weaviate

  • 定位:AI 原生、混合搜索(向量 + 关键词)+ 知识图谱
  • 特点:Go 语言开发;内置 BM25 + 向量融合;原生支持 Rerank;GraphQL API;多模态与 Agent 友好。
  • 规模:千万~亿级,适合中小生产 / 知识图谱 RAG。
  • 适用:智能问答、知识图谱、多模态检索、中小规模 RAG。

3. Qdrant

  • 定位:Rust 高性能、低延迟、带元数据过滤
  • 特点:Rust 核心;HNSW + 二进制量化(BQ);GPU 加速;强过滤 + 排序;内存占用极低。
  • 规模:千万~亿级,低延迟高吞吐。
  • 适用:推荐系统、电商搜索、高并发 RAG、实时过滤场景。

二、轻量级 / 嵌入式(原型 / 本地开发首选)

1. Chroma

  • 定位:Python 原生、零配置、嵌入式 RAG 专用
  • 特点:pip install chromadb即用;内存 / SQLite 持久化;LangChain/LlamaIndex 深度集成;极简 API。
  • 规模:百万级以内,个人项目 / 原型最佳。
  • 适用:RAG 原型、教学演示、个人知识库、小规模应用。

2. FAISS(Facebook)

  • 定位:C++ 高性能向量检索库,非完整数据库
  • 特点:CPU/GPU 加速;索引极全(HNSW/IVF/PQ);量化压缩强;单机性能顶尖。
  • 规模:百万~千万级,离线 / 科研首选。
  • 适用:离线批处理、科研实验、本地高维检索、集成到其他系统。

3. PgVector(PostgreSQL 插件)

  • 定位:关系库 + 向量混合,已有 PG 栈的轻量 RAG
  • 特点:PostgreSQL 扩展;SQL 语法;支持 HNSW/IVF;事务可靠;无缝集成关系数据。
  • 规模:百万~千万级,中小业务友好。
  • 适用:已有 PostgreSQL、需向量 + 结构化联合查询的场景。

三、全托管云服务(零运维 / 快速上线)

1. Pinecone

  • 定位:全托管 Serverless 向量库,零运维
  • 特点:自动扩缩容;SLA 保障;低延迟;元数据过滤;企业级安全;按使用付费。
  • 规模:亿级 + ,全球多区域。
  • 适用:快速上线 SaaS、RAG、推荐、智能客服、不想运维的团队。

2. Zilliz Cloud(Milvus 托管版)

  • 定位:Milvus 官方托管,企业级支持
  • 特点:完全兼容 Milvus;托管运维;全球部署;企业级 SLA;安全合规。
  • 适用:用 Milvus 但不想自建集群、需商业支持的企业。

四、选型速览(RAG 场景最常用)

  • 本地原型 / 个人项目 → Chroma(最简单)
  • 中小规模生产 / 混合搜索 → Weaviate / Qdrant
  • 大规模企业级 RAG → Milvus
  • 已有 PostgreSQL → PgVector
  • 零运维快速上线 → Pinecone / Zilliz Cloud
posted @ 2026-05-27 21:32  静心笃行。  阅读(35)  评论(0)    收藏  举报