agent的记忆系统和MCP协议
一、RAG 与企业级 AI 助手的区别
1.1、RAG(半智能)局限
- 不理解上下文
- 无法主动办事
- 仅知识检索,不做事务处理
1.2、企业真正需要的 AI 助手
- 多轮对话记忆
- 主动调用 API 工具
- 工作流自动化
二、记忆系统
短期记忆
- 实现:checkpointer
- 原理:每轮从存储加载历史到上下文对话窗口
- 优化:消息剪枝(保留最近几条 / 最近若干 token)、语义存储、历史压缩
- 支持存储:redis、mongo、postgresql,不支持 mysql
长期记忆
- 实现:store,跨会话存储用户偏好
- 需要绑定用户 ID
- 存储:短期+长期可用 PostgreSQL;高并发建议 Redis
常用记忆组件
- ConversationBufferMemory:对话缓冲记忆,简单历史上下文
- Chatmessagehistory:复杂聊天场景
- 关键:prompt 问题要精准
三、MCP 模型上下文协议
1、作用
- 统一 LLM 与外部世界连接:文件、数据库、第三方 API
- 只需开发 Server + Client,减少适配成本
2、核心协议
2.1. 消息协议:JSON-RPC 2.0
2.2. 传输协议
- Stdio:本地标准输入输出
- SSE:远程长连接,server 主动推送
- Streamable HTTP:无状态,无需长连接
3、拓展思考
- 接入真实 API:考虑频率限制、异常处理
- 多工具选择:工具描述要唯一,便于 LLM 精准选择
- 提升记忆:使用 memory 组件
- 生产级选型:企业级用 Langchain / Langgraph,Coze、Dify 不适合生产

浙公网安备 33010602011771号