上一页 1 2 3 4 5 6 7 ··· 495 下一页
摘要: 上一节我们体验了“手动维护聊天记录”,每次都要: 把用户发言添加到 history 把模型输出添加到 history 每轮都手动调用 getMessages() 构造上下文 await history.addMessage(new HumanMessage(input)); await histor 阅读全文
posted @ 2025-11-14 14:57 Zhentiw 阅读(32) 评论(0) 推荐(0)
摘要: 大模型本身是无状态的,每次调用都只看当前输入。如果要在多轮对话中维持上下文,就需要 Memory 模块来存储和管理对话历史。 LangChain.js 针对 Memory 提供了多个工具类,先来学习最常用的 ChatMessageHistory 快速上手案例: import { ChatMessag 阅读全文
posted @ 2025-11-14 14:55 Zhentiw 阅读(15) 评论(0) 推荐(0)
摘要: RAG 标准流程: 索引:外挂知识库 检索 生成 Advanced RAG 针对上述 3 个阶段做了优化。例如检索阶段,新增了 检索前处理 以及 检索后处理。 检索前处理: 查询转换 查询扩充 ...... 查询扩充(Query Expansion) 在不改变用户意图的前提下,添加相关词语或同义表达 阅读全文
posted @ 2025-11-09 20:03 Zhentiw 阅读(41) 评论(0) 推荐(0)
摘要: 回忆 RAG 关键步骤: 文本切割 嵌入处理 存储向量数据库 向量数据库可以分为这几种类型: 内存型 本地自托管 云托管 LangChain 内置了 MemoryVectorStore,这就是一个内存型向量库,用于将文档向量存储到内存中,适合本地调试、快速演示,零依赖、即插即用。 MemoryVec 阅读全文
posted @ 2025-11-08 19:49 Zhentiw 阅读(61) 评论(0) 推荐(0)
摘要: 回忆 RAG 关键步骤: 文本切割 嵌入处理 存储向量数据库 嵌入处理,又称之为向量化操作。核心就是将文本转为向量的形式,从而为下一步做数学运算做准备。 "今天的天气真好,万里无云" [ 0.3297254741191864, 0.7386181354522705, -3.3423418998718 阅读全文
posted @ 2025-11-07 14:56 Zhentiw 阅读(23) 评论(0) 推荐(0)
摘要: 为什么需要切割? 回忆一下 RAG 的流程: 用户提问 从知识库检索相关内容 将检索到的内容和用户问题一起交给模型推理 如果文档不切割,检索阶段就只能以整篇为单位,长文会超出模型的 Token 限制,无法一次性送进模型。 快速上手 如何切割? 最通用的是使用 RecursiveCharacterTe 阅读全文
posted @ 2025-11-06 15:07 Zhentiw 阅读(33) 评论(0) 推荐(0)
摘要: CheerioWebBaseLoader 作用是抓取指定网页并解析 HTML 内容,提取需要的纯文本数据。 这个 Loader 底层依赖 cheerio,语法类似 jQuery,可以方便地选择 HTML 元素并提取内容,适用于解析静态 HTML 网页。 pnpm add @langchain/com 阅读全文
posted @ 2025-11-06 14:51 Zhentiw 阅读(31) 评论(0) 推荐(0)
摘要: 很多时候,我们需要加载额外的数据,比如 RAG 架构中,需要外挂知识库。 外部数据的形式千差万别:可能是一份 PDF 文件、一张表格、一段代码,甚至是来自网络的实时信息。针对这些需求,LangChain 提供了一整套开箱即用的 Loader 工具,帮助我们高效地加载各种结构化或非结构化的数据,并统一 阅读全文
posted @ 2025-11-05 15:07 Zhentiw 阅读(22) 评论(0) 推荐(0)
摘要: 所谓条件路由(Conditional Routing),就是在一条 AI 推理/数据处理流水线里,先依据输入内容、上下文或运行时信号做一次判别,再把请求分发到不同的子流程(链)上执行。本质上是受控的 if/else:先“判别”,再“选择”,最后“执行”,避免“一个提示词走天下”。 在 LangCha 阅读全文
posted @ 2025-11-04 15:08 Zhentiw 阅读(27) 评论(0) 推荐(0)
摘要: RunnableSequence .pipe() 是逐个拼接,RunnableSequence.from([...]) 则是显式声明流程结构,将多个步骤写成数组更清晰。 课堂练习:快速上手示例 import { ChatOllama } from "@langchain/ollama"; impor 阅读全文
posted @ 2025-11-03 14:45 Zhentiw 阅读(25) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 ··· 495 下一页