小龙虾-热门论文抓取


在 OpenClaw 中,由于它本身就是一个强大的 AI Agent 框架,你完全不需要自己去写复杂的外部定时脚本。OpenClaw 内置了完善的自动化调度能力(CronHeartbeat机制),可以直接让 Agent 定时去帮你抓取、总结并推送到你的手机或电脑上。

针对你的需求(自动抓取 GitHub Trending、Hugging Face 榜单、Arxiv 论文并推送),这里有三种由浅入深的实现方式:

方式一:使用内置的独立 Cron 任务(最简单,推荐)

OpenClaw 支持创建独立的 Cron 任务,在指定时间唤醒大模型(Agent),让大模型利用其自带的网络搜索工具(Web Search/Browser)去获取信息并总结。

你可以直接在终端中运行以下命令,设置一个每天早上 9 点运行的日报任务:

openclaw cron add \
  --name "AI 前沿日报" \
  --cron "0 9 * * *" \
  --session isolated \
  --model opus \
  --message "请使用网络搜索工具执行以下任务:
1. 获取今天 GitHub Trending (Python/C++ 语言) 下与 AI/LLM 相关的排名前 3 的开源项目。
2. 浏览 Hugging Face 的 Daily Papers 或热门模型榜单,挑选 2 个最值得关注的。
3. 将这些内容总结成一篇简短的『AI 前沿日报』,包含项目/论文名称、核心亮点一句话介绍和原链接。
请直接输出最终总结,不要说多余的话。" \
  --announce \
  --channel telegram \
  --to "@你的Telegram用户名"

解析:

  • --cron "0 9 * * *":每天早上 9:00 执行。
  • --session isolated:在隔离的 Session 中运行,不污染你的日常对话历史。
  • --model opus:复杂的总结和信息筛选推荐用更聪明的模型(如 Claude 3.5 Sonnet 或 Opus)。
  • --announce--channel / --to:将结果直接推送到你配置好的 OpenClaw 频道(如 Telegram、Slack 或 Discord 等)。

方式二:使用 Heartbeat(适合高频监控)

如果你不想每天看一篇长文,而是希望“只要有爆款新项目/重磅论文出现,立刻推给我”,可以使用 OpenClaw 的 Heartbeat(心跳) 机制。

  1. 在你的工作区创建或修改 HEARTBEAT.md 文件:

    # Heartbeat checklist
    
    - 检查 GitHub Trending 榜单,如果出现 Star 增速极快的 AI 领域新项目,总结其亮点。
    - 检查 Hugging Face 有没有最新发布且极具讨论度的大模型。
    - 如果没有特别亮眼的内容,请回复 `HEARTBEAT_OK`(保持静默)。如果有,请生成一段 200 字以内的快讯。
    
  2. 在配置文件中开启心跳:

    {
      agents: {
        defaults: {
          heartbeat: {
            every: "2h", // 每 2 小时让 Agent 巡逻一次
            target: "last"
          }
        }
      }
    }
    

这样,Agent 每 2 小时就会带着这个 prompt 去网上巡逻一次。如果全是水文,它会静默;一旦有类似 DeepSeek-V3 这种重磅发布,它就会主动给你发消息。

方式三:编写专属的 OpenClaw Extension(适合需要极高稳定性的重度玩家)

如果大模型自己去搜索有时候会漏掉数据(因为搜索引擎 API 的限制),作为 AI 负责人,你可以自己写一个轻量级的 OpenClaw Extension (插件),使用确定性的代码去调 API,然后再喂给 LLM 总结。

extensions/ 目录下创建一个你的自定义插件:

  1. 获取数据源(代码层)
    • GitHub Trending:可以通过非官方 API 或 RSS 抓取。
    • Hugging Face:调用 https://huggingface.co/api/daily_papers (他们有官方 API 暴露每日热门论文)。
    • Arxiv:调用 Arxiv API 按照特定的类别(cs.CL, cs.AI)拉取。
  2. 定义工具:将这些逻辑封装成 OpenClaw 的一个 Tool (例如 fetch_ai_trends)。
  3. 结合 Cron:结合前面的 Cron 命令,让 Agent 每天定时调用你的 fetch_ai_trends 工具,拿到结构化 JSON 数据后,让大模型把它翻译成“人话”和技术洞察,再通过 OpenClaw 的 Telegram/Discord 扩展推送到你的手机。

💡 落地建议

作为从 AI 应用切入的练手项目,我建议你直接从“方式一”开始
配置好你最常用的聊天软件(比如接通 Telegram 或微信扩展),把你的 OpenClaw 变成你的 “专属技术大秘”。先跑通 MVP,再逐步根据返回内容的质量,去迭代 Prompt 或者向“方式三”写硬代码扩展演进。这也正是一个 AI 工程师在实际业务中做技术选型(权衡“LLM 柔性搜索”与“代码刚性抓取”)的典型思考”)的成功率抓取”)的 ROI”)的缩影。

posted @ 2026-03-09 21:22  向着朝阳  阅读(0)  评论(0)    收藏  举报