摘要: 传统RAG核心流程; 检索增强整个过一遍,加深印象 核心流程定义:RAG 是通过从外部知识库检索相关信息,并将其作为上下文喂给大模型(LLM),以解决模型幻觉和知识滞后的问题。 技术栈闭环: 数据准备:文档清洗 -> 切片(Chunking)-> 向量化(Embedding)-> 存入向量数据库(如 阅读全文
posted @ 2026-04-07 17:59 asphyxiasea 阅读(2) 评论(0) 推荐(0)
摘要: LangGraph 概述; LangGraph感觉有点像LangChain的手动版,LangChain全部流程都由智能体决策,较为黑盒。 LangGraph与LangChain之间的关系: LangGraph会用到LangChain的组件,就是之前看的哪些,主要是模型组件和工具组件。 LangCha 阅读全文
posted @ 2026-04-03 16:48 asphyxiasea 阅读(3) 评论(0) 推荐(0)
摘要: langchain的运行时; 粗略的看了一下,langchain就是借用了LangGraph的执行引擎。这个是langchain的runtime,runtime是拼凑起来的,LangGraph的runtime更加系统一点。 Runtime与ToolRuntime Runtime = 整个工作流的运行 阅读全文
posted @ 2026-04-02 17:47 asphyxiasea 阅读(2) 评论(0) 推荐(0)
摘要: Ollama多GPU并发行为; 之前一直都是单实例,确实也够了,但是以后做agent的话调用多了,就会有并发问题,虽然代码端能够用生产者-消费者模型解决并发问题,但是worker的并行处理并没有解决,ollama处依然是串行处理请求。 现在即使做了请求削峰问题:请求先缓冲在队列里,Worker按自己 阅读全文
posted @ 2026-04-01 17:25 asphyxiasea 阅读(11) 评论(0) 推荐(0)
摘要: python基础数据类型; 与java还是有区别的,至少叫法不一样 核心的基础数据类型 数值类型(Number)👉 int、float、complex 布尔类型(bool)👉 True / False 字符串(str)👉 不可变的字符序列 容器类型(就是数据结构在python语言中的实现形式) 阅读全文
posted @ 2026-03-31 16:57 asphyxiasea 阅读(3) 评论(0) 推荐(0)
摘要: 代理中间件 现在只知道中间件是能够控​​制代理内部运行机制的方法,但具体实现还是要进一步了解 中间件的概念 中间件的用途包括: 通过日志记录、分析和调试来跟踪代理行为。 转换提示、工具选择和输出格式。 添加重试、回退和提前终止逻辑。 应用速率限制、防护措施和个人身份信息检测。 核心代理循环包括调用模 阅读全文
posted @ 2026-03-30 17:46 asphyxiasea 阅读(4) 评论(0) 推荐(0)
摘要: HTTP中的SSE模式; 模型流式输出主要依赖的就是SSE模型,了解langchain流式输出之前需要知道SSE模式 SSE 是 HTTP 协议的一种单向推送机制,服务器可以持续向客户端发送数据,而客户端不需要反复轮询。 SSE的本质 SSE 的本质就是一个不关闭的 HTTP 响应。 SSE 就是普 阅读全文
posted @ 2026-03-27 17:43 asphyxiasea 阅读(7) 评论(0) 推荐(0)
摘要: Agent与Workflow应用场景问题; 应用场景不同,LLM在其中扮演的角色也不同。LLM有不确定性,所以要根据场景是否能够接纳这种不确定性。 纯 Agent — create_agent 就是之前在dify中写的简单问答模型,模型自己调用工具。 特征:LLM 是唯一决策者,流程完全动态。 典型 阅读全文
posted @ 2026-03-26 16:32 asphyxiasea 阅读(5) 评论(0) 推荐(0)
摘要: langchain工具上下文; 工具上下文可以使工具在运行时改变一些信息,具体了解一下 工具在能够访问运行时信息(例如对话历史记录、用户数据和持久内存)时,功能十分强大。 访问上下文方式: 工具可以通过该参数访问运行时信息ToolRuntime,通过参数传入工具类进行调用和修改。 此参数会自动注入并 阅读全文
posted @ 2026-03-25 17:45 asphyxiasea 阅读(3) 评论(0) 推荐(0)
摘要: langchain的核心组件消息基本用法; 之前也用过模型的文本提示,但文本提示只是消息最简单的用法,消息的用法远远不止这些。 消息有三种基本的使用方法:文本提示、消息提示、字典格式。 文本提示 文本提示是字符串——非常适合简单的生成任务,无需保留对话历史记录。 之前的文件解析结构化输出其实就是文本 阅读全文
posted @ 2026-03-24 16:58 asphyxiasea 阅读(2) 评论(0) 推荐(0)