3.5 个月 4.3 万 Star:nanobot 凭什么成为最火的开源 AI Agent

3.5 个月 4.3 万 Star:nanobot 凭什么成为最火的开源 AI Agent

2026 年 2 月 1 日,GitHub 上出现了一个新仓库。3 个半月后,它的 Star 数突破了 4.3 万,Fork 数超过 7500。

这个项目叫 nanobot,来自香港大学数据科学实验室(HKUDS),一个超轻量级开源 AI Agent 运行时。MIT 协议,Python 写的,一条命令安装。

本文提纲

  1. nanobot 是什么
  2. 为什么它火了
  3. 25+ 模型供应商:不绑定任何一家
  4. 14+ 聊天平台:你的用户在哪,它就在哪
  5. 五层记忆系统:让 Agent 真正"记住"你
  6. 内置工具 + MCP:连接一切
  7. 跟 Claude Code、OpenAI Codex 比差在哪
  8. 快速上手

nanobot 是什么

一句话:一个能读文件、写代码、跑命令、搜网页、记东西、跑定时任务的 AI Agent,而且你可以通过微信、飞书、Telegram、Discord 等 14 个平台跟它对话。

它的核心设计理念是三个词:轻量、可读、可扩展

不像那些动辄几万行代码的 Agent 框架,nanobot 的核心就是一个精简的 Agent Loop:消息进来 → LLM 判断是否需要调用工具 → 执行工具 → 返回结果。整个流程清晰可读,方便研究、修改和二次开发。

来自香港大学数据科学实验室,主要负责人是任旭宾(Xubin Ren / re-bin),目前有超过 45 位贡献者参与开发,版本迭代到 v0.2.0。

为什么它火了

4.3 万 Star 在 3 个半月内达成,这个速度放在整个 AI Agent 赛道里也是顶尖的。分析下来有几个原因:

第一,它解决了"最后一公里"的问题。

市面上大部分 AI Agent 项目还停留在 terminal 交互的阶段——你在命令行里打字,它回复。但真实场景中,你需要 Agent 能在微信群里回复同事,在飞书群里处理工单,在 Telegram 里查天气。nanobot 直接打通了 14 个聊天平台,这让它的实用性远超同类项目。

第二,对中国开发者极其友好。

微信、飞书、钉钉、企业微信、QQ——国内主流通讯工具全覆盖。模型供应商方面,支持火山引擎、阶跃星辰、MiniMax、Moonshot/Kimi、通义千问、小米 MiMo,还有硅基流动这样的国产网关。这在大大小小的 AI Agent 项目里非常少见。

第三,开箱即用。

pip install nanobot-ai,跑 nanobot onboard 走一遍交互式引导,配好 API key,就能用了。内置 WebUI,不用折腾前端。不需要 Docker、不需要 Kubernetes、不需要微服务架构。

第四,真正的开源。

MIT 协议,不是那种"源码可见但协议限制商用"的伪开源。你可以自由修改、分发、商用。

25+ 模型供应商:不绑定任何一家

nanobot 支持 25 个以上的 LLM 供应商,这是它的核心设计哲学——厂商中立

推荐网关:OpenRouter、AiHubMix、硅基流动(SiliconFlow)。用网关的好处是一个 API key 访问所有模型,切换成本为零。

海外直连:Anthropic Claude、OpenAI GPT、Google Gemini、DeepSeek、Azure OpenAI、AWS Bedrock。

国产模型:火山引擎、阶跃星辰、MiniMax、Moonshot/Kimi、通义千问、小米 MiMo。

本地部署:vLLM、Ollama、LM Studio、Atomic Chat。

其他:GitHub Copilot(支持 GPT-5/o 系列)、Hugging Face、NVIDIA NIM、OpenAI Codex。

还有一个贴心功能:fallback_models。你可以配置备选模型,当主模型挂了或者限速时,自动切到备选模型。对生产环境来说,这个功能至关重要。

14+ 聊天平台:你的用户在哪,它就在哪

这是 nanobot 区别于其他 AI Agent 项目最大的亮点。

全部通过 nanobot gateway 统一配置,每个平台独立控制访问权限:

平台 支持能力
Telegram 内联键盘、流式输出、媒体、语音转文字
Discord 线程、论坛帖子、线程隔离会话
WhatsApp 媒体、语音、消息去重
飞书 CardKit 流式、话题、线程、代码块
Slack 线程、文件发送、mrkdwn
微信 多模态、语音、二维码/媒体容错
钉钉 富媒体消息
Microsoft Teams 会话引用裁剪、过期引用清理
QQ 群聊、全类型媒体
企业微信 全类型媒体
Email 附件、自循环防护
Matrix 媒体处理
WebSocket 内置,用于 WebUI

安全方面,每个频道都有 allowFrom 控制:可以指定允许的用户 ID,空值等于拒绝所有,* 等于允许任何人。对未知来源的消息静默拒绝,不泄露 Agent 存在。

五层记忆系统:让 Agent 真正"记住"你

大部分 AI Agent 的记忆只有一层:当前会话的历史消息。会话一关,什么都忘了。

nanobot 设计了一个五层记忆架构

Layer 1: session.messages        — 短期记忆(当前对话)
Layer 2: memory/history.jsonl    — 归档记忆(历史对话压缩摘要)
Layer 3: SOUL.md                 — 人格记忆(语气、风格、语言偏好)
Layer 4: USER.md                 — 用户画像(姓名、习惯、偏好)
Layer 5: memory/MEMORY.md        — 项目知识(决策、架构、经验教训)

最精妙的是 Consolidator 机制:当对话长度接近上下文窗口的一半时,自动触发记忆整合。从对话中提取用户事实、决策、解决方案、事件,写入长期记忆。

两种模式:
- Token 驱动(软模式):移动游标,原始消息保留在磁盘上
- 空闲驱动(硬模式):重写会话文件,节省空间(需手动开启)

还有一个 Dream(梦境)系统:根据观察到的行为模式,自动更新人格文件和用户画像。Agent 会慢慢"学会"你的偏好和习惯,不需要你每次都重复说明。

这种设计思路在开源 Agent 项目里非常少见,甚至很多商业产品都没有做到这个程度。

内置工具 + MCP:连接一切

内置工具

文件操作read_filewrite_fileedit_filelist_dirglobgrep

通信message(进度更新)、spawn(子 Agent 并行工作)

执行exec(Shell 命令)、web_search(默认 DuckDuckGo)、web_fetch(URL 内容抓取)、cron(定时任务)

Shell 执行有沙箱保护:工作空间限制、路径遍历防护、超时控制、环境变量白名单。

MCP 支持

MCP(Model Context Protocol)让你可以接入外部工具服务器——数据库、API、任何系统。nanobot 支持同时连接多个 MCP 服务器,MCP 资源和 prompt 可以直接作为工具暴露给 Agent。

其他亮点

  • /goal 命令(v0.2.0 新增):设定跨回合的长期目标,Agent 会持续追踪进度
  • 定时任务:自然语言描述任务计划,持久化 cron 调度
  • 子 Agentspawn 命令可以启动子 Agent 并行处理任务
  • 图片生成:端到端支持,包括 Ollama 本地生成
  • 语音转文字:统一 Whisper 接口(默认 Groq,可选 OpenAI)
  • OpenAI 兼容 API:可以把 nanobot 嵌入你自己的系统
  • Python SDK:编程式调用
  • Docker / systemd / macOS LaunchAgent:多种部署方式

跟 Claude Code、OpenAI Codex 比差在哪

维度 nanobot Claude Code OpenAI Codex
核心定位 通用 AI Agent 运行时 编程助手 编程助手
模型绑定 25+ 供应商,厂商中立 仅 Anthropic 仅 OpenAI
聊天平台 14+ 仅 Terminal 仅 Terminal
中国平台 微信/飞书/QQ/钉钉/企微
记忆系统 五层 + Dream 仅当前会话 仅当前会话
MCP ✅ 多服务器 有限
WebUI 内置
多语言界面 10 种 英语 英语
定时任务
自部署 ✅ Docker/systemd 云端 云端
协议 MIT 私有 私有
安装 pip install npm install npm install

简单说,Claude Code 和 Codex 是专一但强大的编程助手,而 nanobot 是通用型的 AI Agent 平台。如果你只需要写代码,Claude Code 可能更好;但如果你需要 Agent 在微信群里帮你干活、记住你的偏好、定时执行任务、同时用多个模型——nanobot 是目前开源世界里最成熟的选择。

快速上手

安装只需要一条命令:

# pip 安装
pip install nanobot-ai

# 或者用 uv(更快)
uv tool install nanobot-ai

启动引导:

nanobot onboard

交互式引导会帮你配置:选择模型供应商、输入 API key、选择聊天平台、设置工作空间。5 分钟搞定。

启动 WebUI:

nanobot gateway

浏览器打开 http://127.0.0.1:8765,就能在网页上跟 Agent 对话了。同时配置 Telegram、微信等平台,Agent 会同时响应所有渠道的消息。

更多文档:https://nanobot.wiki

GitHub 仓库:https://github.com/HKUDS/nanobot


作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。

关注公众号,获取更多 AI 技术干货!

posted @ 2026-05-22 23:19  iTech  阅读(2)  评论(0)    收藏  举报