# MCP工具能力清单

关联知识库:# MCP工具能力清单

MCP工具能力清单

文档说明:记录当前Cursor环境中已集成的MCP(Model Context Protocol)工具,帮助用户了解可用能力,更好地提出需求。


工具总览

当前已集成 6个MCP服务器,提供 52+个具体功能

工具 主要能力 典型场景
Firecrawl 网页搜索、抓取、爬虫、结构化提取 生成行业报告、验证链接、市场调研
PromptX 角色切换、记忆管理、工具执行 专业角色扮演、历史经验回忆
Context7 技术文档查询、库ID解析 查询React/Next.js文档、学习新技术
Convex 数据库查询、函数执行、日志分析 后端调试、数据查询、环境配置
Playwright 浏览器自动化、元素交互、截图 Web测试、自动化操作、UI验证
OCR Service 图片文字识别、OCR处理 识别图片文字、处理扫描文档、内容提取

什么是MCP工具?

MCP(Model Context Protocol)是一种协议标准,允许AI接入外部工具和服务,扩展AI的能力边界。

与Prompt的区别

  • Prompt:定义AI的思维方式和工作流程("怎么想")
  • MCP工具:提供AI可调用的执行能力("能做什么")

当前已集成的MCP工具

1. Firecrawl - 强大的网页抓取与搜索引擎

核心能力

  • 智能搜索(search):搜索互联网并自动提取内容,支持高级过滤
  • 单页抓取(scrape):抓取单个网页的完整内容(支持Markdown、HTML、截图、链接等)
  • 网站地图(map):快速发现网站的所有URL结构
  • 深度爬虫(crawl):批量抓取整个网站的内容,支持深度控制
  • 结构化提取(extract):使用LLM从网页中提取结构化数据(支持自定义Schema)
  • ⏱️ 爬虫状态查询(check_crawl_status):查看长时间爬虫任务的进度

典型使用场景

✅ 生成"今日AI行业动态报告" → search搜索最新新闻
✅ 验证文档中的链接是否有效 → scrape批量检查URL状态
✅ 抓取技术文档作为参考 → scrape获取最新技术资料
✅ 竞品分析和数据收集 → crawl批量抓取竞品网站
✅ 提取产品信息(价格、描述) → extract结构化提取

使用提示

  • 当你需要"最新数据"时,AI会自动调用search
  • 当你提供URL时,AI会自动用scrape抓取内容
  • 支持指定国家、语言、时间范围等高级参数
  • crawl任务较慢,适合批量采集;scrape更快,适合单页

2. PromptX - AI意识与记忆系统

核心能力

  • 能力展示(welcome):查看所有可用的角色和工具清单
  • 意识初始化(action/Prime):激活特定专业角色(如:luban、nuwa、sean等)
  • 知识学习(learn):加载专业知识、思维模式、执行技能、工具手册
  • 记忆激活(recall/Activate):回忆相关历史经验和对话
  • 记忆存储(remember/Engram):保存当前对话中的重要经验
  • ⚙️ 项目初始化(init):配置项目级的PromptX环境
  • 工具执行(toolx):运行JavaScript工具扩展能力

典型使用场景

✅ 查看可用能力 → welcome列出所有角色和工具
✅ 专业角色扮演 → action激活"产品经理"或"架构师"角色
✅ 学习工具使用 → learn @manual://工具名
✅ 回忆历史经验 → recall "上次讨论的架构方案"
✅ 积累项目记忆 → remember保存重要决策和经验
✅ 执行自定义脚本 → toolx运行专业分析工具

使用提示

  • 系统内置角色:luban(工具开发)、nuwa(角色创造)、sean(决策顾问)、assistant、noface
  • 记忆系统基于"意识回路"设计(Prime → Experience → Engram → Activate → Integration)
  • 工具使用遵循"先learn手册,再toolx执行"的原则
  • 支持项目级、系统级、用户级三层资源体系

3. Context7 - 技术文档智能查询

核心能力

  • 库ID解析(resolve-library-id):将库名解析为Context7兼容的库ID
  • 文档获取(get-library-docs):获取指定库的最新官方文档

典型使用场景

✅ 查询React最新文档 → resolve-library-id "react" → get-library-docs
✅ 学习Next.js新特性 → 自动获取最新版本文档
✅ 对比不同版本API → 获取特定版本的文档
✅ 快速参考MongoDB用法 → 实时查询官方文档

使用提示

  • 必须先调用resolve-library-id获取准确的库ID
  • 支持指定版本(如:/vercel/next.js/v14.3.0)
  • 可以通过topic参数聚焦特定主题(如:"hooks"、"routing")
  • 返回的文档是经过优化的、适合AI理解的格式

4. Convex - 实时数据库操作平台

核心能力

  • 部署状态(status):查看项目的所有部署环境(dev/prod)
  • 数据查询(data):从数据库表中读取数据(支持分页)
  • 表结构查看(tables):查看所有表和Schema定义
  • 函数元数据(functionSpec):获取所有函数的签名和验证器
  • 函数执行(run):执行Convex的query、mutation、action
  • 临时查询(runOneoffQuery):运行一次性的只读查询脚本
  • 日志查看(logs):获取UDF执行日志和错误信息
  • ⚙️ 环境变量管理(envList/envGet/envSet/envRemove):管理部署环境变量

典型使用场景

✅ 数据库调试 → tables查看Schema,data查询数据
✅ 后端逻辑测试 → run执行函数并查看结果
✅ 日志分析 → logs获取错误日志和执行记录
✅ 环境配置 → envSet设置API密钥等敏感信息
✅ 快速验证逻辑 → runOneoffQuery运行临时查询

使用提示

  • 需要提供Convex项目目录(通常包含package.json和convex/文件夹)
  • 支持开发环境(dev)和生产环境(prod)切换
  • runOneoffQuery适合临时验证,run适合测试正式函数
  • 日志查看支持时间范围和条目数量限制

5. Cursor Playwright - 浏览器自动化测试

核心能力

导航与页面操作

  • 页面导航(navigate):访问指定URL
  • ⬅️ 后退(navigate_back):返回上一页
  • 标签页管理(tabs):列出、创建、关闭、切换标签页

元素交互

  • 点击(click):点击元素(支持左/右/中键、双击、修饰键)
  • ⌨️ 输入(type):在可编辑元素中输入文本
  • 表单填写(fill_form):批量填写多个表单字段
  • 悬停(hover):鼠标悬停在元素上
  • 选择(select_option):在下拉菜单中选择选项
  • 拖拽(drag):拖放元素

信息获取

  • 截图(take_screenshot):捕获页面或元素的截图
  • 快照(snapshot):获取页面的可访问性快照(推荐用于元素交互)
  • 控制台消息(console_messages):获取所有控制台日志
  • 网络请求(network_requests):查看所有网络请求记录

高级操作

  • ⌨️ 按键(press_key):按下键盘按键(如:Enter、Escape)
  • 文件上传(file_upload):上传单个或多个文件
  • 对话框处理(handle_dialog):处理alert、confirm、prompt对话框
  • JavaScript执行(evaluate):在页面上下文中执行JS代码
  • ⏱️ 等待(wait_for):等待文本出现/消失或指定时间
  • 窗口调整(resize):调整浏览器窗口大小
  • 浏览器安装(install):安装指定的浏览器引擎

典型使用场景

✅ Web应用测试 → 自动化功能测试流程
✅ 页面元素验证 → snapshot获取结构,click测试交互
✅ 表单自动填写 → fill_form批量填充表单
✅ UI截图对比 → take_screenshot捕获页面状态
✅ 网络调试 → network_requests查看API调用
✅ JavaScript注入 → evaluate执行自定义脚本

使用提示

  • 优先使用snapshot而非screenshot进行元素定位
  • snapshot返回的ref值用于后续的click、type等操作
  • 支持headless模式,也可以显示浏览器窗口
  • 文件上传需要提供绝对路径
  • 长时间运行的操作可以在后台执行

6. OCR Service - 图片文字识别服务

核心能力

  • 文件路径识别(recognize_text_from_path):从图片文件路径识别文字
  • Base64识别(recognize_text_from_base64):从base64编码的图片数据识别文字
  • 结构化输出:返回文本、置信度、位置信息等详细数据
  • 中文支持:支持中文识别(准确率约90%)

典型使用场景

✅ 识别图片中的文字 → 自动OCR识别并提取文字内容
✅ 处理扫描文档 → 将扫描件转换为可编辑文本
✅ 批量处理图片 → 循环识别多个图片文件
✅ 内容提取分析 → OCR识别后进行语义分析和总结
✅ 发票/票据处理 → 提取金额、日期等关键信息

使用提示

  • 当你提供图片文件时,AI会自动调用OCR工具识别
  • 支持本地文件路径和base64编码两种输入方式
  • 返回结果包含置信度,低于0.8的结果建议人工验证
  • 首次调用需要加载模型,可能需要几秒钟
  • 图片质量影响识别准确率,建议使用清晰、对比度高的图片

项目位置# OCR MCP服务/(根目录)

相关文档


如何更好地使用MCP工具?

1. 明确提出需求

❌ "帮我查一下"
✅ "搜索2025年10月最新的AI行业动态,重点关注技术突破和市场动向"

2. 指定工具场景

✅ "验证README中的所有链接是否有效"(AI会自动用Firecrawl)
✅ "切换到架构师角色分析这个方案"(AI会调用PromptX)
✅ "查询users表的最新10条数据"(AI会使用Convex)

3. 提供必要上下文

✅ 如果涉及Convex,提供项目路径
✅ 如果需要特定角色,说明专业领域
✅ 如果搜索网页,说明关键词和时间范围

能力对比表

MCP工具 主要用途 典型场景 自动触发条件
Firecrawl 网络数据获取 搜索、抓取、爬虫、验证链接 需要最新信息、提供URL、市场调研
PromptX 角色与记忆 专业角色切换、长期记忆、工具执行 明确要求角色、需要历史记忆、工具调用
Context7 技术文档查询 查询库文档、学习新技术 提到技术库名、需要官方文档
Convex 数据库操作 查询数据、调用函数、日志分析 提到数据库、Convex项目、后端调试
Playwright 浏览器自动化 Web测试、页面交互、截图 需要测试Web应用、自动化操作
OCR Service 图片文字识别 识别图片文字、处理扫描文档 提供图片文件、需要识别文字内容

快速示例

示例1:生成AI行业报告(Firecrawl)

用户:"生成今日AI行业动态报告,需要最新数据"
AI自动:
1. 使用Firecrawl search搜索最新AI新闻
2. 使用scrape抓取关键内容
3. 结构化整理成报告

示例2:验证文档链接(Firecrawl)

用户:"检查README中的链接是否有效"
AI自动:
1. 读取README文件
2. 提取所有URL
3. 使用Firecrawl scrape批量验证
4. 报告失效链接

示例3:切换专业角色(PromptX)

用户:"切换到产品经理角色,分析这个功能需求"
AI:
1. 调用PromptX action激活产品经理角色
2. 以产品视角进行分析
3. 提供PRD建议

示例4:查询React文档(Context7)

用户:"React的useEffect有哪些最佳实践?"
AI自动:
1. 调用resolve-library-id获取React库ID
2. 调用get-library-docs获取hooks相关文档
3. 提取useEffect最佳实践

示例5:数据库查询(Convex)

用户:"查看users表的Schema定义"
AI自动:
1. 调用status识别Convex项目
2. 调用tables工具
3. 展示Schema结构

示例6:Web应用测试(Playwright)

用户:"测试登录功能是否正常"
AI自动:
1. 调用navigate访问登录页面
2. 调用snapshot获取页面结构
3. 调用fill_form填写表单
4. 调用click点击登录按钮
5. 验证跳转和结果

示例7:识别图片文字(OCR Service)

用户:"这张图片里写的是什么?"
[提供图片文件]
AI自动:
1. 调用recognize_text_from_path识别图片
2. 提取文字内容
3. 返回识别结果:"图片中的文字是:..."

示例8:处理扫描文档(OCR Service)

用户:"帮我识别这张扫描文档,并总结主要内容"
[提供扫描图片]
AI自动:
1. OCR识别文字
2. 分析文字内容
3. 提取关键信息
4. 生成总结报告

⚙️ 维护说明

何时更新此文档?

  • ✅ 添加新的MCP服务器时
  • ✅ MCP工具能力发生变化时
  • ✅ 发现新的使用场景和最佳实践时
  • ✅ 用户反馈某些说明不清楚时

更新检查清单


补充说明

MCP工具分类

网络与数据

  • Firecrawl:互联网数据获取
  • Context7:技术文档查询
  • Convex:数据库操作

AI增强

  • PromptX:角色系统和记忆管理

自动化测试

  • Playwright:浏览器自动化

内容处理

  • OCR Service:图片文字识别

MCP工具 vs 内置工具

  • MCP工具:需要配置,可扩展(Firecrawl、PromptX、Context7、Convex、Playwright、OCR Service)
  • 内置工具:Cursor默认提供(read_file、grep、terminal、codebase_search等)

与AGENTS.md的关系

  • AGENTS.md:AI的决策逻辑和工作流程(AI视角)
  • 本文档:用户的能力清单和使用指南(用户视角)

两者互补:

  • AGENTS.md告诉AI"怎么选择Prompt"
  • 本文档告诉用户"可以要求AI做什么"


工具统计

类别 工具数量 具体工具
网络与数据 3 Firecrawl、Context7、Convex
AI增强 1 PromptX
自动化测试 1 Playwright
内容处理 1 OCR Service
总计 6个MCP服务器 52+个具体功能

最后更新:2025年1月
版本:v2.1(新增OCR Service)
维护者:Assemble项目团队

posted @ 2025-12-05 23:50  吾以观复  阅读(2)  评论(0)    收藏  举报