摘要: RAG 是一个先选内容再做生成的系统;retriever 不搜索文档,它搜索 chunks。chunks 有问题了那么检索还没开始就已经完蛋了,所以我们可以用结构感知切分修这一点,把标题、代码块、警告框保持在一起。 但 chunks 完全连贯并不意味着就没事了,retriever 还需要正确的搜索信 阅读全文
posted @ 2026-04-30 21:30 deephub 阅读(4) 评论(0) 推荐(0)
摘要: 生产里真正有分量的工作流是能批量处理几千份保险理赔、跑完一周的销售触达节奏、跨系统对账等等的复杂工作,而这些是没办法塞进一次对话轮次里。因为他们的处理时间以天为单位,而不是秒。 一旦动手做这类长时运行的 agent,会遇到一个问题:大多数 agent 架构本质上是无状态的,每次交互都从数据库里把 c 阅读全文
posted @ 2026-04-29 22:02 deephub 阅读(4) 评论(0) 推荐(0)
摘要: 要做这样一个 AI 助手:能上网查资料、能读写文件、能记住过去的对话,还能在执行有风险的操作前先征询人类的意见。听起来是不是很复杂,其实并不是LangChain 生态里现成的几套工具,把开发时间压到了几个小时。不过这里就多了一个问题: create_agent 、Deep Agents 和 Lang 阅读全文
posted @ 2026-04-28 20:05 deephub 阅读(4) 评论(0) 推荐(0)
摘要: 1M token 上下文设置下,DeepSeek-V4-Pro 的单 token 推理 FLOPs 仅为 DeepSeek-V3.2 的 27%,KV Cache 仅为 V3.2 的 10%;V4-Flash 更激进——FLOPs 10%、KV Cache 7%。百万上下文从演示用 demo,变成了 阅读全文
posted @ 2026-04-27 21:20 deephub 阅读(21) 评论(0) 推荐(0)
摘要: Graphify 是一个 Python 工具,同时也是一个 Claude Code skill。它把分析工作一次性做完,把所有内容压缩成一张可查询的知识图谱,放到磁盘上。后续查询走图谱遍历,不再重新读取原始文件。项目简介的数字是:在混合语料库上每次查询的 token 量降低 71.5 倍。虽然这个数 阅读全文
posted @ 2026-04-26 20:46 deephub 阅读(20) 评论(0) 推荐(0)
摘要: ReAct(Reason + Act)架构要解决的问题是开放式研究里最经典的问题。本文要做的是一个 Research Brief Agent:会上网搜索、抓取真实 URL、压缩证据,最终产出一份带真实引用的结构化简报。重点不在于功能,而在于 正确写法——不再依赖那种脆弱的 "Thought: / A 阅读全文
posted @ 2026-04-25 20:48 deephub 阅读(7) 评论(0) 推荐(0)
摘要: 现在介绍LangGraph 和 LangChain 的文章。每一篇的结论都差不多:简单流程用 LangChain,复杂的用 LangGraph。 但是简单和复杂都是相对的,如果是具体问题呢,比如说一个做代码分析、三个 Agent 串起来的流水线,到底该拿哪一个上线? 所以本文用同一个需求分别用两个框 阅读全文
posted @ 2026-04-24 21:12 deephub 阅读(4) 评论(0) 推荐(0)
摘要: 大型语言模型可以写代码、起草合同、总结论文,但它有一个致命缺陷:撒谎的时候极其自信。 这就是我们所说的幻觉,它是一个跨层级的问题:推理参数、系统架构、生成策略、生成后验证、模型训练、持续评估,每一层都有份,所以不能把它当成单点问题来处理。 这篇文章会逐层拆开来讲,从最简单的运行时参数一直到生产级的验 阅读全文
posted @ 2026-04-23 20:46 deephub 阅读(6) 评论(0) 推荐(0)
摘要: 数据增强是现代机器学习中一个绕不开的环节。在计算机视觉里,不做增强就很难训练出一个好的的模型;在时间序列分类领域,虽然也已经沉淀出一套相对成熟的技术——jittering、scaling、window slicing、time warping、permutation、rotation,还有若干基于模 阅读全文
posted @ 2026-04-22 21:54 deephub 阅读(5) 评论(0) 推荐(0)
摘要: 每一次 LLM 调用都是无状态的。模型读上下文窗口,生成响应然后忘掉一切。这对单轮问答没问题。对下列任何一类 Agent,这都是致命的: 保持连续性——"我昨天刚跟人说过这件事,为什么还要再解释一遍?" 从交互中学习——Agent 应当知道这个用户的账户、历史问题、首选语言 积累组织知识——哪些解决 阅读全文
posted @ 2026-04-21 23:20 deephub 阅读(3) 评论(0) 推荐(0)