# MCP工具能力清单
关联知识库:# MCP工具能力清单
MCP工具能力清单
文档说明:记录当前Cursor环境中已集成的MCP(Model Context Protocol)工具,帮助用户了解可用能力,更好地提出需求。
工具总览
当前已集成 6个MCP服务器,提供 52+个具体功能:
| 工具 | 主要能力 | 典型场景 |
|---|---|---|
| Firecrawl | 网页搜索、抓取、爬虫、结构化提取 | 生成行业报告、验证链接、市场调研 |
| PromptX | 角色切换、记忆管理、工具执行 | 专业角色扮演、历史经验回忆 |
| Context7 | 技术文档查询、库ID解析 | 查询React/Next.js文档、学习新技术 |
| Convex | 数据库查询、函数执行、日志分析 | 后端调试、数据查询、环境配置 |
| Playwright | 浏览器自动化、元素交互、截图 | Web测试、自动化操作、UI验证 |
| OCR Service | 图片文字识别、OCR处理 | 识别图片文字、处理扫描文档、内容提取 |
什么是MCP工具?
MCP(Model Context Protocol)是一种协议标准,允许AI接入外部工具和服务,扩展AI的能力边界。
与Prompt的区别:
- Prompt:定义AI的思维方式和工作流程("怎么想")
- MCP工具:提供AI可调用的执行能力("能做什么")
当前已集成的MCP工具
1. Firecrawl - 强大的网页抓取与搜索引擎
核心能力:
- 智能搜索(search):搜索互联网并自动提取内容,支持高级过滤
- 单页抓取(scrape):抓取单个网页的完整内容(支持Markdown、HTML、截图、链接等)
- ️ 网站地图(map):快速发现网站的所有URL结构
- ️ 深度爬虫(crawl):批量抓取整个网站的内容,支持深度控制
- 结构化提取(extract):使用LLM从网页中提取结构化数据(支持自定义Schema)
- ⏱️ 爬虫状态查询(check_crawl_status):查看长时间爬虫任务的进度
典型使用场景:
✅ 生成"今日AI行业动态报告" → search搜索最新新闻
✅ 验证文档中的链接是否有效 → scrape批量检查URL状态
✅ 抓取技术文档作为参考 → scrape获取最新技术资料
✅ 竞品分析和数据收集 → crawl批量抓取竞品网站
✅ 提取产品信息(价格、描述) → extract结构化提取
使用提示:
- 当你需要"最新数据"时,AI会自动调用search
- 当你提供URL时,AI会自动用scrape抓取内容
- 支持指定国家、语言、时间范围等高级参数
- crawl任务较慢,适合批量采集;scrape更快,适合单页
2. PromptX - AI意识与记忆系统
核心能力:
- 能力展示(welcome):查看所有可用的角色和工具清单
- 意识初始化(action/Prime):激活特定专业角色(如:luban、nuwa、sean等)
- 知识学习(learn):加载专业知识、思维模式、执行技能、工具手册
- 记忆激活(recall/Activate):回忆相关历史经验和对话
- 记忆存储(remember/Engram):保存当前对话中的重要经验
- ⚙️ 项目初始化(init):配置项目级的PromptX环境
- 工具执行(toolx):运行JavaScript工具扩展能力
典型使用场景:
✅ 查看可用能力 → welcome列出所有角色和工具
✅ 专业角色扮演 → action激活"产品经理"或"架构师"角色
✅ 学习工具使用 → learn @manual://工具名
✅ 回忆历史经验 → recall "上次讨论的架构方案"
✅ 积累项目记忆 → remember保存重要决策和经验
✅ 执行自定义脚本 → toolx运行专业分析工具
使用提示:
- 系统内置角色:luban(工具开发)、nuwa(角色创造)、sean(决策顾问)、assistant、noface
- 记忆系统基于"意识回路"设计(Prime → Experience → Engram → Activate → Integration)
- 工具使用遵循"先learn手册,再toolx执行"的原则
- 支持项目级、系统级、用户级三层资源体系
3. Context7 - 技术文档智能查询
核心能力:
- 库ID解析(resolve-library-id):将库名解析为Context7兼容的库ID
- 文档获取(get-library-docs):获取指定库的最新官方文档
典型使用场景:
✅ 查询React最新文档 → resolve-library-id "react" → get-library-docs
✅ 学习Next.js新特性 → 自动获取最新版本文档
✅ 对比不同版本API → 获取特定版本的文档
✅ 快速参考MongoDB用法 → 实时查询官方文档
使用提示:
- 必须先调用resolve-library-id获取准确的库ID
- 支持指定版本(如:/vercel/next.js/v14.3.0)
- 可以通过topic参数聚焦特定主题(如:"hooks"、"routing")
- 返回的文档是经过优化的、适合AI理解的格式
4. Convex - 实时数据库操作平台
核心能力:
- 部署状态(status):查看项目的所有部署环境(dev/prod)
- 数据查询(data):从数据库表中读取数据(支持分页)
- 表结构查看(tables):查看所有表和Schema定义
- 函数元数据(functionSpec):获取所有函数的签名和验证器
- ⚡ 函数执行(run):执行Convex的query、mutation、action
- 临时查询(runOneoffQuery):运行一次性的只读查询脚本
- 日志查看(logs):获取UDF执行日志和错误信息
- ⚙️ 环境变量管理(envList/envGet/envSet/envRemove):管理部署环境变量
典型使用场景:
✅ 数据库调试 → tables查看Schema,data查询数据
✅ 后端逻辑测试 → run执行函数并查看结果
✅ 日志分析 → logs获取错误日志和执行记录
✅ 环境配置 → envSet设置API密钥等敏感信息
✅ 快速验证逻辑 → runOneoffQuery运行临时查询
使用提示:
- 需要提供Convex项目目录(通常包含package.json和convex/文件夹)
- 支持开发环境(dev)和生产环境(prod)切换
- runOneoffQuery适合临时验证,run适合测试正式函数
- 日志查看支持时间范围和条目数量限制
5. Cursor Playwright - 浏览器自动化测试
核心能力:
导航与页面操作:
- 页面导航(navigate):访问指定URL
- ⬅️ 后退(navigate_back):返回上一页
- 标签页管理(tabs):列出、创建、关闭、切换标签页
元素交互:
- ️ 点击(click):点击元素(支持左/右/中键、双击、修饰键)
- ⌨️ 输入(type):在可编辑元素中输入文本
- 表单填写(fill_form):批量填写多个表单字段
- 悬停(hover):鼠标悬停在元素上
- 选择(select_option):在下拉菜单中选择选项
- 拖拽(drag):拖放元素
信息获取:
- 截图(take_screenshot):捕获页面或元素的截图
- 快照(snapshot):获取页面的可访问性快照(推荐用于元素交互)
- 控制台消息(console_messages):获取所有控制台日志
- 网络请求(network_requests):查看所有网络请求记录
高级操作:
- ⌨️ 按键(press_key):按下键盘按键(如:Enter、Escape)
- 文件上传(file_upload):上传单个或多个文件
- 对话框处理(handle_dialog):处理alert、confirm、prompt对话框
- JavaScript执行(evaluate):在页面上下文中执行JS代码
- ⏱️ 等待(wait_for):等待文本出现/消失或指定时间
- 窗口调整(resize):调整浏览器窗口大小
- 浏览器安装(install):安装指定的浏览器引擎
典型使用场景:
✅ Web应用测试 → 自动化功能测试流程
✅ 页面元素验证 → snapshot获取结构,click测试交互
✅ 表单自动填写 → fill_form批量填充表单
✅ UI截图对比 → take_screenshot捕获页面状态
✅ 网络调试 → network_requests查看API调用
✅ JavaScript注入 → evaluate执行自定义脚本
使用提示:
- 优先使用snapshot而非screenshot进行元素定位
- snapshot返回的ref值用于后续的click、type等操作
- 支持headless模式,也可以显示浏览器窗口
- 文件上传需要提供绝对路径
- 长时间运行的操作可以在后台执行
6. OCR Service - 图片文字识别服务
核心能力:
- 文件路径识别(recognize_text_from_path):从图片文件路径识别文字
- Base64识别(recognize_text_from_base64):从base64编码的图片数据识别文字
- 结构化输出:返回文本、置信度、位置信息等详细数据
- 中文支持:支持中文识别(准确率约90%)
典型使用场景:
✅ 识别图片中的文字 → 自动OCR识别并提取文字内容
✅ 处理扫描文档 → 将扫描件转换为可编辑文本
✅ 批量处理图片 → 循环识别多个图片文件
✅ 内容提取分析 → OCR识别后进行语义分析和总结
✅ 发票/票据处理 → 提取金额、日期等关键信息
使用提示:
- 当你提供图片文件时,AI会自动调用OCR工具识别
- 支持本地文件路径和base64编码两种输入方式
- 返回结果包含置信度,低于0.8的结果建议人工验证
- 首次调用需要加载模型,可能需要几秒钟
- 图片质量影响识别准确率,建议使用清晰、对比度高的图片
项目位置:# OCR MCP服务/(根目录)
相关文档:
如何更好地使用MCP工具?
1. 明确提出需求
❌ "帮我查一下"
✅ "搜索2025年10月最新的AI行业动态,重点关注技术突破和市场动向"
2. 指定工具场景
✅ "验证README中的所有链接是否有效"(AI会自动用Firecrawl)
✅ "切换到架构师角色分析这个方案"(AI会调用PromptX)
✅ "查询users表的最新10条数据"(AI会使用Convex)
3. 提供必要上下文
✅ 如果涉及Convex,提供项目路径
✅ 如果需要特定角色,说明专业领域
✅ 如果搜索网页,说明关键词和时间范围
能力对比表
| MCP工具 | 主要用途 | 典型场景 | 自动触发条件 |
|---|---|---|---|
| Firecrawl | 网络数据获取 | 搜索、抓取、爬虫、验证链接 | 需要最新信息、提供URL、市场调研 |
| PromptX | 角色与记忆 | 专业角色切换、长期记忆、工具执行 | 明确要求角色、需要历史记忆、工具调用 |
| Context7 | 技术文档查询 | 查询库文档、学习新技术 | 提到技术库名、需要官方文档 |
| Convex | 数据库操作 | 查询数据、调用函数、日志分析 | 提到数据库、Convex项目、后端调试 |
| Playwright | 浏览器自动化 | Web测试、页面交互、截图 | 需要测试Web应用、自动化操作 |
| OCR Service | 图片文字识别 | 识别图片文字、处理扫描文档 | 提供图片文件、需要识别文字内容 |
快速示例
示例1:生成AI行业报告(Firecrawl)
用户:"生成今日AI行业动态报告,需要最新数据"
AI自动:
1. 使用Firecrawl search搜索最新AI新闻
2. 使用scrape抓取关键内容
3. 结构化整理成报告
示例2:验证文档链接(Firecrawl)
用户:"检查README中的链接是否有效"
AI自动:
1. 读取README文件
2. 提取所有URL
3. 使用Firecrawl scrape批量验证
4. 报告失效链接
示例3:切换专业角色(PromptX)
用户:"切换到产品经理角色,分析这个功能需求"
AI:
1. 调用PromptX action激活产品经理角色
2. 以产品视角进行分析
3. 提供PRD建议
示例4:查询React文档(Context7)
用户:"React的useEffect有哪些最佳实践?"
AI自动:
1. 调用resolve-library-id获取React库ID
2. 调用get-library-docs获取hooks相关文档
3. 提取useEffect最佳实践
示例5:数据库查询(Convex)
用户:"查看users表的Schema定义"
AI自动:
1. 调用status识别Convex项目
2. 调用tables工具
3. 展示Schema结构
示例6:Web应用测试(Playwright)
用户:"测试登录功能是否正常"
AI自动:
1. 调用navigate访问登录页面
2. 调用snapshot获取页面结构
3. 调用fill_form填写表单
4. 调用click点击登录按钮
5. 验证跳转和结果
示例7:识别图片文字(OCR Service)
用户:"这张图片里写的是什么?"
[提供图片文件]
AI自动:
1. 调用recognize_text_from_path识别图片
2. 提取文字内容
3. 返回识别结果:"图片中的文字是:..."
示例8:处理扫描文档(OCR Service)
用户:"帮我识别这张扫描文档,并总结主要内容"
[提供扫描图片]
AI自动:
1. OCR识别文字
2. 分析文字内容
3. 提取关键信息
4. 生成总结报告
⚙️ 维护说明
何时更新此文档?
- ✅ 添加新的MCP服务器时
- ✅ MCP工具能力发生变化时
- ✅ 发现新的使用场景和最佳实践时
- ✅ 用户反馈某些说明不清楚时
更新检查清单
补充说明
MCP工具分类
网络与数据:
- Firecrawl:互联网数据获取
- Context7:技术文档查询
- Convex:数据库操作
AI增强:
- PromptX:角色系统和记忆管理
自动化测试:
- Playwright:浏览器自动化
内容处理:
- OCR Service:图片文字识别
MCP工具 vs 内置工具
- MCP工具:需要配置,可扩展(Firecrawl、PromptX、Context7、Convex、Playwright、OCR Service)
- 内置工具:Cursor默认提供(read_file、grep、terminal、codebase_search等)
与AGENTS.md的关系
- AGENTS.md:AI的决策逻辑和工作流程(AI视角)
- 本文档:用户的能力清单和使用指南(用户视角)
两者互补:
- AGENTS.md告诉AI"怎么选择Prompt"
- 本文档告诉用户"可以要求AI做什么"
工具统计
| 类别 | 工具数量 | 具体工具 |
|---|---|---|
| 网络与数据 | 3 | Firecrawl、Context7、Convex |
| AI增强 | 1 | PromptX |
| 自动化测试 | 1 | Playwright |
| 内容处理 | 1 | OCR Service |
| 总计 | 6个MCP服务器 | 52+个具体功能 |
最后更新:2025年1月
版本:v2.1(新增OCR Service)
维护者:Assemble项目团队

浙公网安备 33010602011771号