MCP VS Agent

🔎MCP vs Agent 的关系图谱

MCP(Model Context Protocol)= 标准接口/通用协议

    • MCP 是 Anthropic 提出的一个 开放协议,定义了 大模型如何和外部世界交互 的“语言”和规则。
    • MCP 解决的事“怎么调用工具”的问题,类似操作系统的 驱动协议,统一硬件和系统的沟通方式。
    • 它允许AI Agent通过统一的方式调用各种外部工具和服务。无论是搜索引擎、数据库查询,还是API调用,MCP Server都能提供标准化的接入方式。
    • MCP Server支持两种主要连接模式:
      • Stdio模式:通过命令行进程通信,适合本地开发
      • SSE模式:通过HTTP连接,适合生产环境部署
    • 例如:cursor使用浏览器的MCP工具,它能让
编辑器里的 AI
      不只读文件,还能通过
MCP 扩展
    访问:
    • 本地命令行
    • 数据库

    • 浏览器接口(HTTP 请求、网页爬取)

    • GitLab / GitHub API

浏览器 MCP 就是让 AI 具备浏览器能力,可以执行页面访问、内容抓取、表单提交、甚至脚本操作。也就是说,Cursor 通过 MCP 插件,就能和浏览器或外部系统交互。

Agent = 行动者 / 智能体

  • 拥有自主的目标拆解、规划和执行能力。

  • 需要借助 工具调用能力(可能通过 MCP 提供的接口)来完成复杂任务。

  • 类似于操作系统里的 应用程序,调用协议来干活。

类比理解

  • MCP = 插座和电源标准(220V、三孔插座)

  • 工具 = 电器(灯、电脑、电视)

  • Agent = 使用电器来完成目标的人(比如“我要做饭”,就插电饭煲、开火、洗菜)

👉 没有 MCP,Agent 要为每种电器设计不同的插头,兼容性差、开发成本高。
👉 有了 MCP,Agent 只要“会用插座”,就能调用所有兼容的电器。

总结一句话:

MCP 是 Agent 的“工具带”,Agent 是 MCP 的“使用者”。
前者解决“怎么调用”,后者解决“什么时候、为什么调用”。

浏览器MCP常见应用场景

  1. 自动化测试

    • 打开目标网页,执行点击、输入操作,验证页面元素。

    • 类似 Selenium / Puppeteer,但 AI 可以通过 MCP 来调用。

  2. 数据采集

    • 让 AI 自动访问页面,提取表格/文章/产品信息。

    • 例如抓取 GitLab issue 列表、商品价格。

  3. 研发辅助

    • 在调试新页面时,AI 可以直接用 MCP 打开你正在开发的页面,实时交互。

  4. 个人效率

    • 自动登录、填表、提交表单。

    • 比如快速生成报销单、测试不同登录流程。

浏览器 MCP 的核心能力

  • open_url:打开网页

  • click:点击页面元素

  • input:在输入框填值

  • extract:提取页面 DOM、文本、结构化数据

  • screenshot:截图

  • evaluate:执行 JavaScript


🛠️ Cursor + 浏览器 MCP 的可能用法

  1. 在 Cursor 里调用浏览器 API

    • 通过 MCP,让 AI 打开网页、请求接口、抓取数据。

    • 类似你现在对我用的 web.search() / web.open_url(),但运行在 Cursor 本地。

  2. 安全访问 GitLab / 内部系统

    • MCP 可以接 GitLab API(通过 Access Token)。

    • 这样 AI 在 Cursor 里就能直接查 PR、Issue、Pipeline 状态,而不需要复制粘贴网页内容。

  3. 调试 / 压测场景

    • 可以通过 MCP 调用浏览器 headless 模式(Chromium + Puppeteer)。

    • 用来做 E2E 测试、页面压测脚本生成。


🚀 实际操作

目前 Cursor 已经在支持 MCP,你可以这样搞:

  1. 安装 MCP 扩展

    • 打开 Cursor → 设置 → Experimental / Labs → 启用 MCP。

  2. 配置 MCP Server

    • MCP Server 其实就是一个服务(本地或远程),它暴露 JSON-RPC 接口。

    • 例如一个 browser-mcp,可以封装 Puppeteer / Playwright 提供网页操作能力。

  3. 连接到 Cursor

    • 在 Cursor 的 mcp.json 配置里,填上:

       
      { "servers": { "browser": { "command": "node", "args": ["path/to/browser-mcp.js"] } } }
  4. 在 AI 里使用

    • 然后你可以在对话里直接说 “帮我打开 xxx 网页并抓取标题”,AI 就会调用 MCP 的 browser.openUrl()


⚠️ 注意

  • MCP 目前还比较新,官方支持的“浏览器 MCP”插件还少,很多要自己写。

  • 如果你要访问 GitLab + 浏览器 API,更推荐先写一个简单的 Node.js MCP 服务,把 GitLab API 和 Puppeteer 封装进去。

  • Cursor 自带的 AI 可能会把 MCP 当工具调用,你要保证 Token/隐私数据只在本地。

posted on 2025-09-03 15:38  duanxz  阅读(41)  评论(0)    收藏  举报