上一页 1 2 3 4 5 6 7 8 9 10 ··· 498 下一页
摘要: 在实际开发中,经常还有如下的需求: 禁止模型调用某个工具 强制调用某个工具 注册多个函数工具 禁止模型调用工具 默认情况下,模型会自行决定是否使用 tool。但有时你希望它只能用自己的知识回答,怎么办? 你可以通过 tool_choice: "none" 禁用工具调用。 const result = 阅读全文
posted @ 2025-11-18 01:09 Zhentiw 阅读(59) 评论(0) 推荐(0)
摘要: 作者:谢杰 原子化文件写入,是属于 原子化操作 的一种。那么问题来了,什么又是原子化操作呢? 原子化操作:英语 Atomic,指的是操作要么全部发生,要么完全不发生,对读者而言,中间状态是不可见的。 原子写入(Atomic Write) 可以保证文件不存在中间半写入状态,与之相对应的是 撕裂写(To 阅读全文
posted @ 2025-11-17 15:18 Zhentiw 阅读(69) 评论(0) 推荐(0)
摘要: 目前我们所使用的 Memory,大多只存在于内存中,一旦进程关闭、用户刷新页面,所有历史对话都会丢失。实际项目中,我们常常希望: 让用户“第二次回来”还能接着上次对话继续聊 将多轮聊天记录保存在本地或数据库中,用于分析、审计、训练、回溯 这时候,我们就需要将 Memory 做持久化操作,从而实现“记 阅读全文
posted @ 2025-11-16 23:07 Zhentiw 阅读(88) 评论(0) 推荐(0)
摘要: 上一节我们体验了“手动维护聊天记录”,每次都要: 把用户发言添加到 history 把模型输出添加到 history 每轮都手动调用 getMessages() 构造上下文 await history.addMessage(new HumanMessage(input)); await histor 阅读全文
posted @ 2025-11-14 14:57 Zhentiw 阅读(44) 评论(0) 推荐(0)
摘要: 大模型本身是无状态的,每次调用都只看当前输入。如果要在多轮对话中维持上下文,就需要 Memory 模块来存储和管理对话历史。 LangChain.js 针对 Memory 提供了多个工具类,先来学习最常用的 ChatMessageHistory 快速上手案例: import { ChatMessag 阅读全文
posted @ 2025-11-14 14:55 Zhentiw 阅读(27) 评论(0) 推荐(0)
摘要: RAG 标准流程: 索引:外挂知识库 检索 生成 Advanced RAG 针对上述 3 个阶段做了优化。例如检索阶段,新增了 检索前处理 以及 检索后处理。 检索前处理: 查询转换 查询扩充 ...... 查询扩充(Query Expansion) 在不改变用户意图的前提下,添加相关词语或同义表达 阅读全文
posted @ 2025-11-09 20:03 Zhentiw 阅读(62) 评论(0) 推荐(0)
摘要: 回忆 RAG 关键步骤: 文本切割 嵌入处理 存储向量数据库 向量数据库可以分为这几种类型: 内存型 本地自托管 云托管 LangChain 内置了 MemoryVectorStore,这就是一个内存型向量库,用于将文档向量存储到内存中,适合本地调试、快速演示,零依赖、即插即用。 MemoryVec 阅读全文
posted @ 2025-11-08 19:49 Zhentiw 阅读(89) 评论(0) 推荐(0)
摘要: 回忆 RAG 关键步骤: 文本切割 嵌入处理 存储向量数据库 嵌入处理,又称之为向量化操作。核心就是将文本转为向量的形式,从而为下一步做数学运算做准备。 "今天的天气真好,万里无云" [ 0.3297254741191864, 0.7386181354522705, -3.3423418998718 阅读全文
posted @ 2025-11-07 14:56 Zhentiw 阅读(38) 评论(0) 推荐(0)
摘要: 为什么需要切割? 回忆一下 RAG 的流程: 用户提问 从知识库检索相关内容 将检索到的内容和用户问题一起交给模型推理 如果文档不切割,检索阶段就只能以整篇为单位,长文会超出模型的 Token 限制,无法一次性送进模型。 快速上手 如何切割? 最通用的是使用 RecursiveCharacterTe 阅读全文
posted @ 2025-11-06 15:07 Zhentiw 阅读(50) 评论(0) 推荐(0)
摘要: CheerioWebBaseLoader 作用是抓取指定网页并解析 HTML 内容,提取需要的纯文本数据。 这个 Loader 底层依赖 cheerio,语法类似 jQuery,可以方便地选择 HTML 元素并提取内容,适用于解析静态 HTML 网页。 pnpm add @langchain/com 阅读全文
posted @ 2025-11-06 14:51 Zhentiw 阅读(47) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 10 ··· 498 下一页