AI Agent系列-Google AI Agent学习-互联互通:人与 Agent、Agent 与 Agent、Agent 与货币

Google Agent白皮书讨论了 Agent 与外部世界的三种关键关系。

1. Agents & Humans:更自然、更高带宽的交互

  • 最简单的是聊天式 UI
  • 进阶是结构化输出(JSON),驱动富 UI 或工作流引擎
  • 更进一步是 Computer Use
    • Agent 直接操纵 UI 元素(点击、输入、导航)
    • 通过专门的 UI 控制工具/协议实现
  • 语音与多模态 live 模式让 Agent 成为“可对话的实时助手”:
    • 实时语音双向流
    • 能看到摄像头画面、理解环境
    • 适合维修指导、购物顾问等场景

2. Agents & Agents:A2A 协议与任务式通信

  • 随着企业内部 Agent 数量增长,点对点自定义集成会变成“集成地狱”
  • 白皮书提出 Agent2Agent (A2A) 协议:
    • 每个 Agent 发布一个包含能力与入口的 Agent Card(数字名片)
    • 统一发现与认证方式,使 Agent 能够互相调用
    • 交互以“任务”为单位,而非单次请求响应
    • 支持长时间运行任务与流式状态更新

这为 Level 3 多 Agent 系统提供了基础设施。

3. Agents & Money:为 Agent 经济搭建可信支付层

当 Agent 可以代表人类做购买与交易时,问题变成:

“如果 Agent 买错了,责任在谁?”

白皮书提出两条关键路径:

  • AP2(Agent Payments Protocol)

    • 通过加密签名的“Mandate(授权书)”表达用户意图
    • 为每笔交易建立不可抵赖的审计链路
    • 让 Agent 能在明确授权下自主浏览、谈判和交易
  • x402 协议

    • 基于 HTTP 402(Payment Required)状态码的互联网支付协议
    • 支持机器对机器的微支付,如按调用付费访问 API 或数字内容

两者共同构成了未来 Agentic Web 的“信任与结算层”。

posted @ 2025-12-13 14:08  Eric zhou  阅读(7)  评论(0)    收藏  举报