一份现代知识系统的全景地图
PKM、RAG、Wiki、AI 记忆系统,以及如今实用的 AI 辅助工作流,常常被放在一起讨论,仿佛它们解决的是同一个问题。事实并非如此。它们都与知识有关,但运作在不同层面:
- PKM 帮助人类思考。
- Wiki 帮助团队保存共享知识。
- RAG 帮助机器检索外部知识。
- 记忆系统 帮助 AI 智能体跨时间持久化上下文。
混淆这些系统会导致糟糕的架构设计。
你会看到:Wiki 里塞满了个人草稿笔记,RAG 系统没有可信的信息源,记忆层被当作数据库使用,PKM 工具被强加了它们从未设计来承载的自动化功能。
更好的理解方式是将它们视为知识系统光谱中的不同部分。
本文从结构、检索、所有权、演化和实际应用场景等维度,对比 PKM、RAG、Wiki 和 AI 记忆系统。
一句话总结
最重要的区分是:
PKM 和 Wiki 组织知识结构。RAG 检索知识。记忆系统演化智能体上下文。
这就是核心心智模型。
为什么这些系统容易被混淆
它们在表面行为上有重叠。
它们都可以:
- 存储笔记
- 检索信息
- 回答问题
- 组织参考资料
- 连接想法
但它们的意图不同。
PKM 系统不仅是一个私人 Wiki。Wiki 不仅是 RAG 数据库。RAG 管线不是 AI 记忆。AI 记忆系统不能替代结构化文档。
混淆的根源在于将"知识"视为单一事物。
实际上,知识有多个层次:
- 捕获(Capture)
- 结构化(Structure)
- 检索(Retrieval)
- 解读(Interpretation)
- 复用(Reuse)
- 演化(Evolution)
不同的系统优化不同的阶段。
四大范式
1. PKM(个人知识管理)
PKM 全称 Personal Knowledge Management,即个人知识管理。
它是捕获、组织、连接和使用知识以服务个人工作的实践。
典型的 PKM 系统包括:
- Obsidian
- Logseq
- Notion
- 纯 Markdown 文件夹
- Zettelkasten 卡片笔记系统
- "第二大脑"体系
PKM 是人类驱动的。目标不仅是存储,而是更好地思考。
PKM 擅长什么
- 学习新领域
- 发展原创想法
- 随时间连接笔记
- 写文章或书籍
- 跟踪个人研究
- 构建第二大脑
好的 PKM 系统是以一种"有用的方式"保持混乱。它支持未完成的想法、部分构思、私人上下文和不断演化的概念。
这就是为什么 PKM 不等于文档——文档追求清晰,PKM 容忍模糊。
PKM 的失败模式
PKM 容易变成:
- 垃圾堆积场
- 文件夹分类法项目
- 生产力美学
- 工具优化爱好
- 无人使用的私人存档
主要风险是只收集不综合。
如果你只保存信息却从不加工,你拥有的不是知识系统,而是一个个人垃圾填埋场。
观点
PKM 应该为复用而优化,而非为捕获。
捕获一切感觉很有生产力,但会产生债务。真正的价值在笔记被连接、改写、压缩并用于输出时才会显现。
2. Wiki
Wiki 是为共享参考而设计的结构化知识库。
典型的 Wiki 系统包括:
- DokuWiki
- MediaWiki
- Confluence
- BookStack
- 基于 Git 的文档站点
- 公司内部知识库
Wiki 通常比 PKM 更正式。
它应该回答:我们知道什么?当前版本在哪里?
Wiki 擅长什么
- 团队文档
- 运维手册(Runbook)
- 产品知识
- 政策文档
- 技术参考
- 新人入职资料
- 稳定的领域知识
Wiki 是一种社会契约。它声明:这个页面就是这项知识存在的地方。这使得所有权和维护变得至关重要。
Wiki 的失败模式
Wiki 经常因为过时而失败。
常见问题:
- 页面无人负责
- 截图过期
- 页面重复
- 规范版本不清晰
- 层级过深
- 缺少维护节奏
一个信息过时的 Wiki 比没有 Wiki 更糟糕,因为它制造了虚假的信心。
观点
Wiki 应该是"无聊的"——这是一种褒奖。
好的 Wiki 不是创意诞生的地方,而是稳定知识在对他人有用之后被保存的地方。
3. RAG(检索增强生成)
RAG 全称 Retrieval Augmented Generation,即检索增强生成。
它是一种 AI 架构:系统在让语言模型生成回答之前,先检索相关的外部信息。
基本 RAG 管线通常包含:
- 文档
- 分块(Chunking)
- 嵌入或搜索索引
- 检索
- 可选的重排序(Reranking)
- 提示词组装
- LLM 生成
RAG 是机器驱动的。目标不是创造知识,而是在查询时为模型提供相关上下文。
RAG 擅长什么
- 基于文档的问答
- 内部搜索助手
- 客服机器人
- 技术文档助手
- 合规查询
- 大型语料库研究
- 将 LLM 连接到最新信息
RAG 在模型不能或不应该记忆信息时特别有用。
RAG 的失败模式
RAG 常在团队将其视为"魔法搜索"时失败。
常见问题:
- 分块质量差
- 检索效果弱
- 上下文噪声大
- 缺少元数据
- 没有可信信息源
- 文档过时
- 缺乏评估体系
- 没有人工反馈回路
RAG 不能修复糟糕的知识管理。如果底层内容碎片化、过时或自相矛盾,RAG 系统只会自信地把这些混乱展示出来。
观点
RAG 不是知识策略,RAG 是访问策略。
它帮助机器访问知识,但不决定哪些知识是有效的、被维护的、权威的或有用的。
4. AI 记忆系统
AI 记忆系统赋予智能体超越单次提示或对话的持久上下文。
它们可能存储:
- 用户偏好
- 过去的决策
- 长期事实
- 任务历史
- 摘要
- 反思
- 提取的实体
- 情景记忆(Episodic Memory)
- 语义记忆(Semantic Memory)
相关示例和理念:
- MemGPT 风格的记忆分层
- 长期智能体记忆
- 情景记忆
- 语义记忆
- 向量记忆
- 档案记忆
- 工具状态记忆
- 反思型智能体
AI 记忆是智能体驱动的。目标是连续性。
AI 记忆擅长什么
- 个人助手
- 长期运行的编程智能体
- 研究智能体
- 客服智能体
- 教学系统
- 工作流自动化
- 持久型伴侣
- 多会话任务执行
记忆在系统必须表现得像记住了什么时才重要。
AI 记忆的失败模式
记忆系统在缺乏管理时十分危险。
常见问题:
- 记住错误事实
- 存储过多
- 隐私风险
- 偏好过时
- 记忆排序差
- 记忆中毒
- 缺少遗忘机制
- 将记忆与事实混淆
记忆系统需要治理。它应该回答:
- 什么应该被记住?
- 谁批准了它?
- 它应该存活多久?
- 什么时候应该被遗忘?
- 如何纠正错误记忆?
观点
AI 记忆不等于长上下文。
长上下文让模型在当前会话中看到更多。记忆决定什么跨越时间存续。
这是两个不同的问题。
核心差异对比
结构 vs 检索 vs 演化
理解这些系统最简单的方式是比较它们所优化的目标。
| 维度 | PKM | Wiki | RAG | AI 记忆 |
|---|---|---|---|---|
| 驱动方 | 人类 | 团队 | 机器 | 智能体 |
| 优化目标 | 个人演化 | 共享结构 | 机器检索 | 连续性 |
| 核心问题 | 我的理解如何变化? | 当前答案是什么? | 哪些文档相关? | 智能体应记住什么? |
| 容错性 | 容忍模糊 | 要求清晰 | 要求精确检索 | 要求治理 |
PKM 优化个人演化——关注你的理解如何随时间变化。输出往往是更好的心智模型、文章、决策或可复用洞见。PKM 的核心不是快速查找,而是长期意义建构。
Wiki 优化共享结构——关注稳定知识。当人们信任它时,Wiki 才能发挥作用。
RAG 优化机器检索——关注在正确时间检索正确上下文。当检索质量高且源语料库可信时,RAG 才有效。
AI 记忆优化连续性——关注跨会话的持久性。当记忆改善未来行为且不被过时或错误上下文污染时,它才有效。
何时使用 PKM
当知识是个人的、未完成的或探索性的时候,使用 PKM。
适用场景:
- 学习分布式系统
- 规划文章
- 研究 LLM 架构
- 收集读书笔记
- 构建第二大脑
- 跟踪个人实验
当你还在思考时,使用 PKM。
示例
你正在学习 RAG 评估。你收集了:文章、基准测试笔记、图表、实现思路、自己实验的失败记录。
这些首先属于 PKM。之后,当知识稳定下来,你可以发表文章或将其转化为文档。
何时使用 Wiki
当知识需要被共享和维护时,使用 Wiki。
适用场景:
- 团队入职
- API 文档
- 运维手册
- 架构决策记录(ADR)
- 产品知识
- 部署说明
- 技术支持流程
当其他人需要一个可靠的答案时,使用 Wiki。
示例
你的团队有一种正确的方式将 Hugo 站点部署到 S3 和 CloudFront。
这不应该只存在于某人的私人笔记中。它属于一个有明确所有权的 Wiki 或文档系统。
何时使用 RAG
当 AI 系统在查询时需要访问外部知识时,使用 RAG。
适用场景:
- 基于文档的聊天机器人
- 内部文档搜索助手
- 帮助文章问答
- 法律或合规助手
- 大型文档集研究
- 代码文档开发者助手
当问题是"模型需要其权重之外的信息"时,使用 RAG。
示例
你有数百篇技术文章,想要一个助手基于这些文章回答问题。RAG 是好的选择——但前提是文档足够干净,能够被有效检索。
何时使用 AI 记忆
当智能体需要连续性时,使用 AI 记忆。
适用场景:
- 记住项目约定的编程智能体
- 记住偏好的个人助手
- 持续长期调查的研究智能体
- 记住学生进度的教学智能体
- 记住之前交互的客服智能体
- 跟踪目标的自主智能体
当系统必须随时间改善时,使用记忆。
示例
一个编程智能体应该记住:
- 项目使用 Go
- 测试用特定命令运行
- 用户偏好最小依赖
- 数据库迁移遵循某种约定
这不仅是检索,这是持久的运行上下文。
这些系统如何组合
最有用的系统是混合型的。
一个成熟的知识架构可能是这样的:
- PKM 用于个人探索
- Wiki 用于稳定的共享知识
- RAG 用于机器访问
- AI 记忆 用于长期运行的智能体连续性
每一层都有自己的职责。
模式一:PKM → Wiki
这是人类知识管线。
流程:私下捕获笔记 → 连接想法 → 提炼洞见 → 发布稳定知识 → 作为共享参考维护。
这是个人研究如何变成组织知识的路径。
模式二:Wiki → RAG
这是机器访问管线。
流程:维护权威 Wiki 页面 → 索引它们 → 检索相关段落 → 生成有根据的回答 → 链接回原始页面。
这是最干净的 RAG 模式之一。Wiki 保持信息源地位,RAG 成为访问层。
模式三:RAG + 记忆
这是智能体连续性管线。
流程:RAG 检索外部事实 → 记忆存储用户或任务上下文 → 智能体结合两者 → 未来行为改善。
- RAG 回答:知识库怎么说?
- 记忆回答:关于这个用户/项目/任务,什么是重要的?
模式四:PKM + AI 助手
这是混合思考管线。
流程:人类捕获笔记 → AI 总结并建议链接 → 人类编辑验证 → 知识变得更结构化 → 部分页面升级为 Wiki 或发表。
AI 增强 PKM 系统,但不应该拥有真相的所有权。
常见架构错误
错误一:把 RAG 当 Wiki
RAG 不是知识库。它不会自动创建权威结构,它只从已有内容中检索。如果源文档质量差,RAG 就变成了一个"自信地展示烂知识的界面"。
错误二:把记忆当数据库
AI 记忆是选择性上下文,不是通用存储。数据库存储记录,记忆改变行为。如果你需要精确事实,用数据库或知识库;如果你需要连续性,用记忆。
错误三:把 PKM 当文档
PKM 可以是混乱的,文档不应该。私人笔记可以包含半成型的想法,共享文档应该包含稳定、被维护的知识。
错误四:把 Wiki 当思考工具
Wiki 可以支持思考,但不适合早期探索。如果每个早期想法都必须成为精致的页面,人们就会停止写作。用 PKM 做粗糙思考,用 Wiki 做持久知识。
错误五:把长上下文当记忆
长上下文不是记忆。它只在上下文存在时有帮助。记忆是持久的、选择性的、可更新的,有时还需要遗忘。
知识系统光谱
这些系统构成了一个从人类思考到 AI 连续性的光谱:
人类思考 ←——————————————————————→ AI 连续性
PKM Wiki RAG AI 记忆
(个人演化) (共享结构) (机器检索) (智能体连续性)
方向很重要。知识通常始于个人想法,变成共享结构,被索引用于机器检索,然后成为持久智能体行为的一部分。
这就是现代知识栈。
LLM Wiki 的定位
LLM Wiki 风格的系统位于 Wiki 和 AI 架构之间。
它们不是经典 RAG。它们不仅在查询时检索块,而是尝试将知识预先结构化为页面、摘要、实体和链接。这使它们更接近编译型知识系统。
PKM → Wiki → LLM Wiki → RAG → AI 记忆
↑
(预结构化知识)
这就是为什么 LLM Wiki 更接近知识系统架构,而不是普通 RAG。
安全与治理
当知识系统存储敏感或过时信息时,风险随之而来。
PKM 治理
- 什么应该保持私密?
- 什么应该发布?
- 什么应该删除?
Wiki 治理
- 谁负责每个页面?
- 上次审核是什么时候?
- 什么是权威版本?
RAG 治理
- 哪些来源被索引?
- 回答是否引用了来源?
- 检索效果如何评估?
- 哪些内容被排除?
记忆治理
- 什么被记住了?
- 用户能否查看记忆?
- 用户能否删除记忆?
- 错误记忆如何纠正?
记忆需要最严格的治理,因为它能无声地影响未来行为。
最终结论
PKM、RAG、Wiki 和 AI 记忆系统不是竞争对手。它们是不同问题的不同答案。
- PKM 问:我如何随时间更好地思考?
- Wiki 问:我们知道什么?可信版本在哪里?
- RAG 问:模型现在应该使用什么外部上下文?
- AI 记忆问:这个智能体未来应该记住什么?
一旦你分清了这些问题,架构就变得显而易见。
用 PKM 来思考。用 Wiki 来共享真相。用 RAG 来检索。用记忆来保持连续性。
未来不是一个知识系统取代所有其他系统。
未来是分层的知识架构。
浙公网安备 33010602011771号