03 2026 档案
摘要:LangChain ReAct Agent 实战:Tool 描述才是工具调用的 “灵魂” 最近在折腾 LangChain 的 ReAct 智能体(Agent)时,踩了个不少新手都会踩的坑:明明代码逻辑看着没问题,工具却要么不调用、要么乱调用,折腾了半天才发现,问题根源竟在Tool 的描述信息上! 今
阅读全文
摘要:终于讲到langchain如何注册自定义的tool,以及如何在agent里使用自定义的tool LangChain入门:自定义Tool注册全解析,3步实现工具集成 在LangChain的Agent体系中,Tool是连接大语言模型与外部功能的核心桥梁,也是扩展模型能力边界的关键组件——它本质上就是给L
阅读全文
摘要:基于上节的内容如何将流程改为如下: LangChain 并行执行实战:三步高效生成高质量长文 在大模型应用开发中,我们经常需要同时生成多个关联内容,再基于这些内容完成最终的复杂任务。传统的串行执行方式效率低下,而 LangChain 提供的并行执行能力,能完美解决这个问题,大幅提升内容生成的效率与逻
阅读全文
摘要:现在有这样一个需求,要求使用AI智能化完成这个任务。 1、先处理大纲:构建大纲提示词 → 获得大纲内容 2、再处理注意事项:构建注意事项提示词 → 获得注意事项内容 3、最后整合生成文章:整合所有信息 → 构建最终提示词 → 获得完整文章 流程图如下: 代码实现: from langchain_op
阅读全文
摘要:LangChain PythonREPL + 大模型:让 AI 直接生成并执行 Python 代码 在大模型的实际应用中,我们经常遇到一个痛点:大模型擅长理解和推理,但在精准计算、逻辑运算上容易出错。 而 LangChain 实验性工具库中的 PythonREPL,完美解决了这个问题。它能让大模型直
阅读全文
摘要:极简高效!LangChain + Milvus 快速搭建企业级语义检索系统 在 RAG 大模型应用开发中,向量数据库 + 嵌入模型的组合是实现精准语义检索的核心,而 LangChain 与 Milvus 的搭配,堪称轻量化、高效率的最优解。无需复杂配置,无需手写海量向量处理逻辑,就能快速搭建出稳定、
阅读全文
摘要:LangChain高效加载 Excel 数据为文档,解锁大模型数据处理新能力 在大模型应用开发中,我们经常需要将结构化的 Excel 数据转化为大模型可理解的文档格式,而 LangChain 作为大模型应用开发的主流框架,提供了极简且高效的解决方案,完美适配 Excel 数据的加载与转换需求。 一、
阅读全文
摘要:【LangChain 实战】利用 LangChain 高效提取 Word 文档纯文本内容 适用场景:文档智能处理 | RAG 知识库构建 | AI 大模型语料预处理 | 办公文档自动化 在 AI 应用开发、RAG 检索增强生成、企业知识库搭建等场景中,从 Word 文档中提取纯净文本是必不可少的前置
阅读全文
摘要:EasyOCR 应用 在日常办公、数据处理、资料整理中,我们经常会遇到图片转文字的需求:截图里的文案无法复制、PDF 扫描件不能编辑、证件信息需要手动录入、外文图片需要提取文本…… 传统手动录入效率极低,而专业 OCR 工具要么收费,要么配置复杂。 今天给大家分享一款零门槛、高性能、免费开源的 Py
阅读全文
摘要:高效提取 PDF 中的所有图片:一键批量导出,无损保存超实用! 在日常处理 PDF 文档时,我们经常会遇到需要提取 PDF 内图片的场景:整理文档中的图表、保存白皮书里的高清插图、提取报告中的数据配图、收集课件里的关键图片…… 手动截图不仅模糊、效率极低,还会丢失原图分辨率,有没有更高效、无损的解决
阅读全文
摘要:解决PDF读取内存溢出!轻量分页加载实现方案 在日常开发中,我们经常会遇到PDF文件读取的需求——可能是解析文档内容、提取关键信息,也可能是生成文档预览。但如果面对几十页、上百页的大型PDF,直接一次性加载全部内容,很容易出现内存溢出、程序卡顿甚至崩溃的问题,尤其是在服务器端或资源有限的设备上,这个
阅读全文
摘要:上一篇博客介绍了,加载pdf按页分割的方法,今天讲讲如何自定义分割pdf文件。 LangChain 实战:PDF 文档智能加载与自定义文本分割 在基于大模型的 RAG 应用开发中,PDF 文档加载与精细化文本分割是核心基础环节。分割的质量直接决定了后续向量检索的精准度和大模型回答的效果。今天给大家分
阅读全文
摘要:加载 PDF 原始页面,保留完整内容不分割 在基于 LangChain 处理 PDF 文档的场景中,很多开发者默认使用的加载方式会自动将文档内容分割成小块,虽然便于后续检索,但有时我们更需要保留 PDF 原始页面的完整内容 —— 比如解析出团通知书、合同类 PDF 时,按页码完整提取内容才能保证信息
阅读全文
摘要:文档中的文字加载后,就要向量化存在向量数据库里,提供给后面的业务逻辑使用,但是在这之前还需要对文本进行分割,分割后的结果在进行向量化,今天主要讲一讲langchain常用的几种文本分割。 LangChain 文本分割:从基础到进阶的实战指南 在基于大模型构建知识库、RAG 等应用时,文本分割是核心前
阅读全文
摘要:上节讲如何将文本进行向量化,本节讲讲如何将文本文件加载到程序中,进行下一步处理,langchain 的 TextLoader提供了这个功能。 langchain 的 TextLoader 并非支持所有文本格式,它的核心作用是读取「纯文本类文件」,对非纯文本格式(如带格式的文档、二进制文件)无法直接解
阅读全文
摘要:之前讲了milvus向量数据库如何使用,但是如何把文本信息转成向量?这个问题一直没有讲,今天就讲讲,这是构建RAG关键的一步,咱们使用all-MiniLM-L6-v2本地模型将文本转成向量。 为什么用它最直接的原因是免费还好用,调用各大平台的向量模型是要收费的,所以使用本地化向量模型从部署到使用都是
阅读全文
摘要:解锁 Milvus 新玩法:基于文本匹配的精准检索实战 在向量数据库的主流应用里,大家通常更关注向量相似度检索,但 Milvus 除了强大的向量检索能力外,还内置了非常实用的文本匹配功能。我们不需要额外引入搜索引擎,就能直接在文本字段上做精准关键词检索,快速搭建支持文本过滤的检索服务。 一、Milv
阅读全文
摘要:milvus也能像ES一样具有全文检索能力,某些场景下可以使用milvus来实现全文检索,使用场景和代码如何实现请看下文。 基于 Milvus 实现高效全文检索:BM25 算法的落地实践 全文检索是信息检索领域的核心能力,广泛应用于搜索引擎、智能问答、文档匹配等场景。传统的全文检索方案往往需要手动处
阅读全文
摘要:Milvus 三种核心查询方式:get/query/迭代器 在向量数据库的实际应用中,查询功能是衔接数据存储与业务落地的核心环节。Milvus 作为主流向量数据库,针对不同业务场景设计了多种灵活的查询方式,其中 get 主键查询、query 条件过滤查询、query_iterator 迭代器查询是最
阅读全文
摘要:在向量检索场景中,我们常遇到“按指定字段分组,获取每组最相似结果”的需求(如按文档ID分组,返回每个文档下与查询向量最匹配的内容)。Milvus的分组检索(group by)功能,可高效实现这一需求,无需额外二次筛选。本文将聚焦Milvus分组检索核心知识点,搭配极简前置操作(其他操作一带而过),帮
阅读全文
浙公网安备 33010602011771号