[LangChain] 15. 内存型向量库

回忆 RAG 关键步骤：

文本切割
嵌入处理
存储向量数据库

向量数据库可以分为这几种类型：

内存型
本地自托管
云托管

LangChain 内置了 MemoryVectorStore，这就是一个内存型向量库，用于将文档向量存储到内存中，适合本地调试、快速演示，零依赖、即插即用。

MemoryVectorStore 整体工作流：

把要检索的文本包装成 Document；
调用 vectorstore.addDocuments() 触发嵌入；
用 similaritySearch(...) 或 similaritySearchWithScore(...) 做相似度检索。

1. 实例化内存向量库

import { MemoryVectorStore } from "langchain/vectorstores/memory";

const store = new MemoryVectorStore();

console.log(store)

效果：

MemoryVectorStore {
  lc_serializable: false,
  lc_kwargs: {},
  lc_namespace: [ 'langchain', 'vectorstores', 'memory' ],
  embeddings: undefined,
  memoryVectors: [],
  similarity: [Function: cosine]
}

embeddings：嵌入工具
memoryVectors：存储的内存向量

2. 指定嵌入工具

自定义嵌入类：NomicEmbeddings

import { MemoryVectorStore } from "langchain/vectorstores/memory";
import { NomicEmbeddings } from "./utils/embed.js"

const embeddings = new NomicEmbeddings(4);

const store = new MemoryVectorStore(embeddings);

console.log(store)

效果：

MemoryVectorStore {
  lc_serializable: false,
  lc_kwargs: {},
  lc_namespace: [ 'langchain', 'vectorstores', 'memory' ],
  embeddings: NomicEmbeddings {
    caller: AsyncCaller {
      maxConcurrency: Infinity,
      maxRetries: 6,
      onFailedAttempt: [Function: defaultFailedAttemptHandler],
      queue: [PQueue]
    },
    model: 'nomic-embed-text',
    apiUrl: 'http://localhost:11434/api/embeddings',
    concurrency: 4
  },
  memoryVectors: [],
  similarity: [Function: cosine]
}

3. 添加文档

添加文档可以调用 vectorstore 实例的 addDocuments 方法，该方法接收一个数组，数组里面每一项是 Document 实例对象，之后会自动调用 embeddings.embedDocuments 生成向量并存入内存。

await vectorstore.addDocuments([
  new Document({
    pageContent: "Vue 是一个渐进式前端框架，易于上手。",
    metadata: { id: "a1", tag: "frontend" },
  }),
  new Document({
    pageContent: "React 通过 JSX 描述 UI，强调组件化与状态管理。",
    metadata: { id: "b2", tag: "frontend" },
  }),
  new Document({
    pageContent: "LangChain 提供 RAG 组件与向量检索工具。",
    metadata: { id: "c3", tag: "ai" },
  }),
]);

具体示例：

import { MemoryVectorStore } from "langchain/vectorstores/memory";
import { NomicEmbeddings } from "./utils/embed.js";
import { TextLoader } from "langchain/document_loaders/fs/text";
import { RecursiveCharacterTextSplitter } from "langchain/text_splitter";

const loader = new TextLoader("data/kong.txt");

const docs = await loader.load();

const splitter = new RecursiveCharacterTextSplitter({
  chunkSize: 64,
  chunkOverlap: 0,
});

const splittedDocs = await splitter.splitDocuments(docs);

const embeddings = new NomicEmbeddings(4);

const store = new MemoryVectorStore(embeddings);

await store.addDocuments(splittedDocs);

console.log(store.memoryVectors);

4. 检索操作

首先创建一个检索器：

const retriever = vectorstore.asRetriever(2)

vectorstore.asRetriever(2) 是一个简写，等价于 vectorstore.asRetriever({ k: 2 })，表示创建一个检索器，每次查询返回前 2 条最相似的 Document。返回值是一个 VectorStoreRetriever

快速上手示例：

import { MemoryVectorStore } from "langchain/vectorstores/memory";
import { NomicEmbeddings } from "./utils/embed.js";
import { TextLoader } from "langchain/document_loaders/fs/text";
import { RecursiveCharacterTextSplitter } from "langchain/text_splitter";

const loader = new TextLoader("data/kong.txt");

const docs = await loader.load();

const splitter = new RecursiveCharacterTextSplitter({
  chunkSize: 64,
  chunkOverlap: 0,
});

const splittedDocs = await splitter.splitDocuments(docs);

const embeddings = new NomicEmbeddings(4);

const store = new MemoryVectorStore(embeddings);

await store.addDocuments(splittedDocs);

// 创建一个检索器，现在仓库已经有值了
const retriever = store.asRetriever(1);

const res = await retriever.invoke("茴香豆是做什么用的");

console.log(res);

store.asRetriever(1)

store.asRetriever({
  k : 1
})

配置对象支持如下的参数：

const retriever = vectorstore.asRetriever({
  k: 4,
  searchType: "mmr",
  searchKwargs: { fetchK: 20, lambda: 0.5 },
  filter: (doc) => doc.metadata?.source?.endsWith("data/kong.txt"),
  tags: ["demo", "kong"],
  metadata: { lesson: "RAG-intro" },
  verbose: true,
});

k：每次查询返回的文档条数；不填默认 4。asRetriever(2) 的数字简写等价于 { k: 2 }。
searchType：检索策略：
- "similarity"（默认）：按向量相似度排序返回前 k 条；
- "mmr"：最大边际相关性（Maximal Marginal Relevance），在相关性与多样性之间折中。
searchKwargs：MMR 的细化参数，仅当 searchType: "mmr" 时生效
- fetchK：先抓取的候选集合规模（越大，MMR 可选空间越大）
- lambda：0～1 的权衡系数；0 更偏向多样性、1 更偏向相关性
filter：用于预筛候选文档，返回 true 的文档才参与检索。
callbacks：检索过程中的回调钩子（开始/结束/错误等），与 LangChain 的可观测性机制对接。
tags：给该检索器打标签，便于在日志/跟踪里区分。
metadata：附加的上下文信息，会随运行一起记录，便于审计与调试。
verbose：是否开启详细日志，默认 false。

另外配置项也支持数字简写，方法签名如下：

asRetriever(kOrFields?, filter?, callbacks?, tags?, metadata?, verbose?)

不过想跳过中间的参数再传后面的，就用 undefined 占位。例如：

const r3 = vectorstore.asRetriever(3, undefined, undefined, ["demo", "kong"]);

另外还有 similaritySearch 以及 similaritySearchWithScore 方法，用法也和上面类似。

平时在使用的时候更推荐使用 asRetriever 方法先创建一个检索器，后期进行检索的时候只需要传入检索文本即可。

-EOF-

posted @ 2025-11-08 19:49 Zhentiw 阅读(78) 评论(0) 收藏举报

刷新页面返回顶部

Answer1215

[LangChain] 15. 内存型向量库

公告