随笔分类 -  RAG

摘要:不用 Embedding 也能做知识 Agent?Vercel 用文件系统干掉了向量检索管线 上周刷到 Vercel 的一篇博客,标题直接就是"Build knowledge agents without embeddings"。一开始以为是噱头——做知识检索不用向量数据库?读完发现,他们的思路确实 阅读全文
posted @ 2026-05-25 14:56 iTech 阅读(3) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-24 Top 10 AI 技术要闻 StreetAI Memory:适用于 LLM 的持久化记忆方案,输入 Token 可减少高达 80% StreetAI Memory 是一个位于应用层与 LLM API 之间的持久化记忆中间件,使用 SQLite 存储对话数据 阅读全文
posted @ 2026-05-24 07:31 iTech 阅读(14) 评论(0) 推荐(0)
摘要:Claude Code 为什么放弃 RAG 用 Grep 搜索代码?大型代码库最佳实践全解析 2025 年 9 月,Anthropic 工程团队发表了一篇题为《Effective Context Engineering for AI Agents》的文章,里面有一段话信息量巨大: Claude Co 阅读全文
posted @ 2026-05-23 13:44 iTech 阅读(47) 评论(0) 推荐(0)
摘要:面试 AI Agent 工程师会被问什么?40+ 真题 + 知识图谱全梳理 AI Agent 工程师已经成了 2025-2026 年最火的岗位之一。OpenAI、Anthropic、Google、字节、百度都在招,薪资也给得很猛。但问题来了——Agent 工程师的面试到底考什么?跟普通后端面试有什么 阅读全文
posted @ 2026-05-21 20:10 iTech 阅读(59) 评论(0) 推荐(0)
摘要:RAG 领域有个根深蒂固的假设:检索必须靠向量相似度匹配。 把文档切成块,算 embedding,塞进向量数据库,查询时算余弦相似度取 top-K——这套流程已经成了"标准答案"。但问题在于,语义相似不等于真正相关。 你问一个金融报告里的具体数字,向量检索可能把看起来"像"但完全不是同一张表的段落拽 阅读全文
posted @ 2026-05-07 23:00 iTech 阅读(179) 评论(0) 推荐(0)
摘要:读源码像读小说?试了 DeepWiki 和 Zread,我再也不想裸读 GitHub 了 上周想研究 LangChain 的 Agent 调度逻辑,打开 GitHub 一看——1500+ 文件,核心模块散落在五个目录里。README 写了 3000 字,但我想知道的具体问题一个都没回答。 折腾了两小 阅读全文
posted @ 2026-05-07 22:45 iTech 阅读(87) 评论(0) 推荐(0)
摘要:AI 技术日报 - 2026-05-01 Top 10 AI 技术要闻 Show HN: MAItion — 具备可插拔连接器和聊天界面的开源 RAG MAItion 是一个开源的一体化 AI 知识管理工具,将现有知识库与大语言模型深度结合,支持聊天、搜索和交互式数据操作。技术亮点包括:支持本地和远 阅读全文
posted @ 2026-05-01 07:43 iTech 阅读(49) 评论(0) 推荐(0)
摘要:Open WebUI:为什么它是目前最值得推荐的自托管 AI 平台 当你享受 ChatGPT 带来的便利时,是否想过这些对话数据去了哪里?对于企业而言,将敏感代码或商业文档上传到第三方 API 服务是一个不可接受的风险。这就是自托管 AI 平台的价值所在——而在众多选择中,Open WebUI 正以 阅读全文
posted @ 2026-04-05 11:03 iTech 阅读(322) 评论(0) 推荐(0)