AI Agent系列-Google AI Agent学习-互联互通:人与 Agent、Agent 与 Agent、Agent 与货币
Google Agent白皮书讨论了 Agent 与外部世界的三种关键关系。
1. Agents & Humans:更自然、更高带宽的交互
- 最简单的是聊天式 UI
- 进阶是结构化输出(JSON),驱动富 UI 或工作流引擎
- 更进一步是 Computer Use:
- Agent 直接操纵 UI 元素(点击、输入、导航)
- 通过专门的 UI 控制工具/协议实现
- 语音与多模态 live 模式让 Agent 成为“可对话的实时助手”:
- 实时语音双向流
- 能看到摄像头画面、理解环境
- 适合维修指导、购物顾问等场景
2. Agents & Agents:A2A 协议与任务式通信
- 随着企业内部 Agent 数量增长,点对点自定义集成会变成“集成地狱”
- 白皮书提出 Agent2Agent (A2A) 协议:
- 每个 Agent 发布一个包含能力与入口的 Agent Card(数字名片)
- 统一发现与认证方式,使 Agent 能够互相调用
- 交互以“任务”为单位,而非单次请求响应
- 支持长时间运行任务与流式状态更新
这为 Level 3 多 Agent 系统提供了基础设施。
3. Agents & Money:为 Agent 经济搭建可信支付层
当 Agent 可以代表人类做购买与交易时,问题变成:
“如果 Agent 买错了,责任在谁?”
白皮书提出两条关键路径:
-
AP2(Agent Payments Protocol)
- 通过加密签名的“Mandate(授权书)”表达用户意图
- 为每笔交易建立不可抵赖的审计链路
- 让 Agent 能在明确授权下自主浏览、谈判和交易
-
x402 协议
- 基于 HTTP 402(Payment Required)状态码的互联网支付协议
- 支持机器对机器的微支付,如按调用付费访问 API 或数字内容
两者共同构成了未来 Agentic Web 的“信任与结算层”。
浙公网安备 33010602011771号