agent的记忆系统和MCP协议

一、RAG 与企业级 AI 助手的区别

1.1、RAG(半智能)局限

  • 不理解上下文
  • 无法主动办事
  • 仅知识检索,不做事务处理

1.2、企业真正需要的 AI 助手

  • 多轮对话记忆
  • 主动调用 API 工具
  • 工作流自动化

二、记忆系统

短期记忆

  • 实现:checkpointer
  • 原理:每轮从存储加载历史到上下文对话窗口
  • 优化:消息剪枝(保留最近几条 / 最近若干 token)、语义存储、历史压缩
  • 支持存储:redis、mongo、postgresql,不支持 mysql

长期记忆

  • 实现:store,跨会话存储用户偏好
  • 需要绑定用户 ID
  • 存储:短期+长期可用 PostgreSQL;高并发建议 Redis

常用记忆组件

  • ConversationBufferMemory:对话缓冲记忆,简单历史上下文
  • Chatmessagehistory:复杂聊天场景
  • 关键:prompt 问题要精准

三、MCP 模型上下文协议

1、作用

  • 统一 LLM 与外部世界连接:文件、数据库、第三方 API
  • 只需开发 Server + Client,减少适配成本

2、核心协议

2.1. 消息协议:JSON-RPC 2.0
2.2. 传输协议

  • Stdio:本地标准输入输出
  • SSE:远程长连接,server 主动推送
  • Streamable HTTP:无状态,无需长连接

3、拓展思考

  1. 接入真实 API:考虑频率限制、异常处理
  2. 多工具选择:工具描述要唯一,便于 LLM 精准选择
  3. 提升记忆:使用 memory 组件
  4. 生产级选型:企业级用 Langchain / Langgraph,Coze、Dify 不适合生产
posted @ 2026-03-28 18:43  时光如你般美好  阅读(7)  评论(0)    收藏  举报