会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Answer1215
博客园
首页
新随笔
联系
管理
上一页
1
2
3
4
5
6
7
8
9
10
···
498
下一页
2025年11月18日
[LangChain] 20. Tools配置
摘要: 在实际开发中,经常还有如下的需求: 禁止模型调用某个工具 强制调用某个工具 注册多个函数工具 禁止模型调用工具 默认情况下,模型会自行决定是否使用 tool。但有时你希望它只能用自己的知识回答,怎么办? 你可以通过 tool_choice: "none" 禁用工具调用。 const result =
阅读全文
posted @ 2025-11-18 01:09 Zhentiw
阅读(59)
评论(0)
推荐(0)
2025年11月17日
【转】[Node.js] 文件写入的原子化与并发操作
摘要: 作者:谢杰 原子化文件写入,是属于 原子化操作 的一种。那么问题来了,什么又是原子化操作呢? 原子化操作:英语 Atomic,指的是操作要么全部发生,要么完全不发生,对读者而言,中间状态是不可见的。 原子写入(Atomic Write) 可以保证文件不存在中间半写入状态,与之相对应的是 撕裂写(To
阅读全文
posted @ 2025-11-17 15:18 Zhentiw
阅读(69)
评论(0)
推荐(0)
2025年11月16日
[LangChain] 19. 持久化记忆
摘要: 目前我们所使用的 Memory,大多只存在于内存中,一旦进程关闭、用户刷新页面,所有历史对话都会丢失。实际项目中,我们常常希望: 让用户“第二次回来”还能接着上次对话继续聊 将多轮聊天记录保存在本地或数据库中,用于分析、审计、训练、回溯 这时候,我们就需要将 Memory 做持久化操作,从而实现“记
阅读全文
posted @ 2025-11-16 23:07 Zhentiw
阅读(88)
评论(0)
推荐(0)
2025年11月14日
[LangChian] 18. 自动维护聊天记录
摘要: 上一节我们体验了“手动维护聊天记录”,每次都要: 把用户发言添加到 history 把模型输出添加到 history 每轮都手动调用 getMessages() 构造上下文 await history.addMessage(new HumanMessage(input)); await histor
阅读全文
posted @ 2025-11-14 14:57 Zhentiw
阅读(44)
评论(0)
推荐(0)
[LangChain] 17. Memory基础
摘要: 大模型本身是无状态的,每次调用都只看当前输入。如果要在多轮对话中维持上下文,就需要 Memory 模块来存储和管理对话历史。 LangChain.js 针对 Memory 提供了多个工具类,先来学习最常用的 ChatMessageHistory 快速上手案例: import { ChatMessag
阅读全文
posted @ 2025-11-14 14:55 Zhentiw
阅读(27)
评论(0)
推荐(0)
2025年11月9日
[LangChain] 16. 检索优化
摘要: RAG 标准流程: 索引:外挂知识库 检索 生成 Advanced RAG 针对上述 3 个阶段做了优化。例如检索阶段,新增了 检索前处理 以及 检索后处理。 检索前处理: 查询转换 查询扩充 ...... 查询扩充(Query Expansion) 在不改变用户意图的前提下,添加相关词语或同义表达
阅读全文
posted @ 2025-11-09 20:03 Zhentiw
阅读(62)
评论(0)
推荐(0)
2025年11月8日
[LangChain] 15. 内存型向量库
摘要: 回忆 RAG 关键步骤: 文本切割 嵌入处理 存储向量数据库 向量数据库可以分为这几种类型: 内存型 本地自托管 云托管 LangChain 内置了 MemoryVectorStore,这就是一个内存型向量库,用于将文档向量存储到内存中,适合本地调试、快速演示,零依赖、即插即用。 MemoryVec
阅读全文
posted @ 2025-11-08 19:49 Zhentiw
阅读(89)
评论(0)
推荐(0)
2025年11月7日
[LangChain] 14. 嵌入处理
摘要: 回忆 RAG 关键步骤: 文本切割 嵌入处理 存储向量数据库 嵌入处理,又称之为向量化操作。核心就是将文本转为向量的形式,从而为下一步做数学运算做准备。 "今天的天气真好,万里无云" [ 0.3297254741191864, 0.7386181354522705, -3.3423418998718
阅读全文
posted @ 2025-11-07 14:56 Zhentiw
阅读(38)
评论(0)
推荐(0)
2025年11月6日
[LangChian] 13. 文本切割
摘要: 为什么需要切割? 回忆一下 RAG 的流程: 用户提问 从知识库检索相关内容 将检索到的内容和用户问题一起交给模型推理 如果文档不切割,检索阶段就只能以整篇为单位,长文会超出模型的 Token 限制,无法一次性送进模型。 快速上手 如何切割? 最通用的是使用 RecursiveCharacterTe
阅读全文
posted @ 2025-11-06 15:07 Zhentiw
阅读(50)
评论(0)
推荐(0)
[LangChain] 12. Web Loader
摘要: CheerioWebBaseLoader 作用是抓取指定网页并解析 HTML 内容,提取需要的纯文本数据。 这个 Loader 底层依赖 cheerio,语法类似 jQuery,可以方便地选择 HTML 元素并提取内容,适用于解析静态 HTML 网页。 pnpm add @langchain/com
阅读全文
posted @ 2025-11-06 14:51 Zhentiw
阅读(47)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
10
···
498
下一页
公告