Claw 和 Hermes 精选 10 个零成本 Skills:让 AI Agent 能力翻倍
Claw 和 Hermes 精选 10 个零成本 Skills:让 AI Agent 能力翻倍
AI Agent 的能力边界,取决于你给它装了什么 Skills。
Claw 是腾讯 CodeBuddy WorkBuddy 的 AI Agent,Hermes 是开源的 AI Agent 框架。两者都支持通过 Skill 扩展能力——而好的 Skill 不是锦上添花,是把聊天窗口变成真正的生产力工具。
本文从信息获取、文档处理、知识管理、系统增强四个维度,精选了 10 个零成本的 Skill,每一个都经过实际验证。
十大 Skills 能力地图
先看全局。这 10 个 Skill 覆盖了一个 AI Agent 日常工作的核心链路:
MERMAID_BLOCK_0
上图把 10 个 Skills 分成了四个能力域。下面逐个展开。
一、信息获取
1. Agent Browser
安装名:agent-browser
Agent Browser 让 AI 直接打开网页、滚动、点击、展开内容、截图和提取信息。对于需要交互才能看到内容的页面(比如需要点击"展开全文"的文章、需要滚动的长页面),这是唯一靠谱的方案。
核心能力:
- 打开任意网页并模拟真实浏览行为
- 点击按钮、展开折叠区域、滚动加载更多
- 对指定区域截图
- 将页面内容结构化输出
典型场景:抓取需要滚动加载的电商评论、提取动态渲染的单页应用内容、自动截图存档。
示例指令:
请打开这个网页,完整阅读需要展开和滚动后才能看到的内容,整理成结构化摘要,并为关键页面截图留档。
2. Web Search
安装名:web-search
LLM 的训练数据有截止日期。遇到"最近一个月"、"最新动态"这类时效性问题,Web Search 先搜再答,大幅降低过时信息的风险。
核心能力:
- 联网搜索实时信息
- 按时间范围过滤结果
- 整理多来源信息为结构化摘要
典型场景:竞品调研、新闻汇总、技术方案选型前的快速摸底。
示例指令:
请搜索最近 1 个月 AI 办公工具领域的重要动态,整理成要点摘要,并附上来源链接。
3. yt-dlp-downloader
安装名:yt-dlp-downloader
下载视频、提取音频和字幕,然后交给 AI 做摘要、翻译或知识卡片。把视频内容变成可检索、可复用的文本资产。
核心能力:
- 支持 YouTube、Bilibili 等主流平台
- 下载视频、提取音频、抓取字幕
- 下载后自动衔接 AI 处理
典型场景:课程视频转学习笔记、访谈音频转文字稿、技术演讲提炼要点。
示例指令:
请帮我下载这个视频的字幕和音频,完成后整理一份重点摘要给我。
二、文档处理
4. 办公文档四件套(PDF / DOCX / PPTX / XLSX)
安装名:pdf、docx、pptx、xlsx
这四个 Skill 解决的是同一个问题:让 AI 直接读写你手上的文件,而不是让你先手动转换格式再复制粘贴。
核心能力:
- PDF:提取正文、表格、OCR 扫描件、拆分合并、表单填写
- DOCX:生成正式文档、整理结构、补目录页码、处理批注修订
- PPTX:读取幻灯片、总结每页内容、压缩结构、重做演示文稿
- XLSX:清洗表格数据、补公式、整理列、输出汇总
典型场景:从 PDF 合同中提取关键条款、把散乱数据整理成 Excel 报表、一键生成 Word 会议纪要。
示例指令:
请把这个 PDF 中的表格数据提取出来,整理成 Excel 文件,并按月份汇总。
三、知识管理
5. Obsidian
安装名:obsidian
如果你用 Obsidian 管理知识库,这个 Skill 可以让 AI 直接读取、写入、搜索你的笔记。省去了手动搬运内容、反复说明背景的成本。
核心能力:
- 读取和写入 Obsidian Vault 中的笔记
- 按关键词搜索笔记内容
- 自动整理对话为结构化笔记
- 支持双链和标签体系
典型场景:把工作对话整理成日报笔记、搜索 Vault 中某个主题的所有记录、将零散灵感归并为知识卡片。
示例指令:
请把今天的工作对话整理成 Obsidian 笔记,包含已完成事项、待办事项和关键结论,保存到日报目录。
6. Local Whisper
安装名:local-whisper(Hermes 中为 whisper)
本地语音转文字,模型下载后离线运行,不需要把音频上传到任何第三方服务。对于内部会议、敏感访谈这类隐私场景,这是唯一正确的选择。
核心能力:
- 支持 99 种语言的语音识别
- 完全离线运行,数据不出本机
- 转写后可直接衔接摘要、纪要、待办生成
典型场景:会议录音转纪要、课程音频提炼重点、语音备忘录转行动清单。
示例指令:
请把这段会议录音转成文字,整理成会议纪要,包含主要结论、行动项和负责人。
四、系统增强
7. Self-improvement
安装名:self-improvement
这个 Skill 不做即时炫技的事。它做的事更长远:记录你的偏好、纠正和经验,让 AI 在长期使用中越来越懂你。
核心能力:
- 记录任务失败原因和修正方案
- 沉淀用户明确表达过的偏好
- 在后续任务中自动参考历史经验
- 避免在相同问题上反复犯错
典型场景:你纠正过"不要用 emoji"、"报告用正式语气",AI 会记住并在后续对话中遵守。
8. Skill Scanner
安装名:skill-scanner
第三方 Skill 本质上是可执行代码。安装前先做安全审查,发现可疑依赖、硬编码配置和潜在风险。对新手来说,这是基础安全兜底。
核心能力:
- 扫描 Skill 的依赖和脚本内容
- 识别可疑的外部请求和权限需求
- 生成安全审查报告
典型场景:安装来源不明的 Skill 前先跑一次扫描、团队内部安全合规检查。
9. Find Skills
安装名:find-skills
Skill 生态越来越丰富,选择反而成了门槛。Find Skills 根据你的需求描述,自动筛选候选 Skill 并解释差异,降低选择成本。
核心能力:
- 根据自然语言描述匹配 Skill
- 对比多个候选方案的优劣
- 推荐尚未安装但适合当前需求的 Skill
示例指令:
我想让 AI 帮我处理网页采集和截图,请帮我找出合适的 Skill,并说明区别。
10. Frontend Design
安装名:frontend-design
让 AI 生成前端页面时不再只是"能跑就行",而是同时考虑设计感、风格一致性和视觉层次。对于需要对外展示的页面,差别肉眼可见。
核心能力:
- 生成带设计感的落地页、活动页、仪表盘
- 支持多种风格方向(现代、极简、科技感等)
- 输出可直接预览的完整页面代码
典型场景:快速生成产品落地页、重做老旧后台界面、活动报名页快速验证。
示例指令:
请帮我设计一个活动报名的落地页,风格现代专业,突出报名入口和活动亮点。
组合使用建议
单个 Skill 解决单个问题,组合使用才是真正的效率倍增器。以下是几组实战推荐的组合打法:
信息采集 + 文档输出:Agent Browser 抓取网页 → Web Search 补充最新信息 → DOCX 生成调研报告。从信息收集到报告输出,一条龙。
视频学习 + 知识沉淀:yt-dlp-downloader 下载课程视频 → Local Whisper 转写音频 → Obsidian 保存学习笔记。把一小时的课程视频变成可检索的文字笔记。
语音会议 + 任务跟进:Local Whisper 转写会议录音 → Self-improvement 记录团队偏好 → DOCX 生成会议纪要 → XLSX 输出行动项跟踪表。
快速建站 + 安全审查:Find Skills 找到合适的前端 Skill → Skill Scanner 做安全检查 → Frontend Design 生成落地页。三步完成从选型到交付。
安装与起步
这 10 个 Skill 全部免费,来源均为 GitHub 开源仓库。在 Claw(WorkBuddy)中通过技能市场一键安装;在 Hermes 中通过配置文件添加 Skill 名称即可启用。
建议从你最需要的能力域开始,先装 2-3 个高频使用的 Skill,跑通一个完整工作流,再逐步扩展。Skills 不是越多越好,而是越贴合你的工作流越好。
作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。
关注公众号,获取更多 AI 技术干货!

浙公网安备 33010602011771号