AI Agent系列-Google AI Agent学习-互联互通：人与 Agent、Agent 与 Agent、Agent 与货币

Google Agent白皮书讨论了 Agent 与外部世界的三种关键关系。

1. Agents & Humans：更自然、更高带宽的交互

最简单的是聊天式 UI
进阶是结构化输出（JSON），驱动富 UI 或工作流引擎
更进一步是 Computer Use：

Agent 直接操纵 UI 元素（点击、输入、导航）
通过专门的 UI 控制工具/协议实现

语音与多模态 live 模式让 Agent 成为“可对话的实时助手”：

实时语音双向流
能看到摄像头画面、理解环境
适合维修指导、购物顾问等场景

2. Agents & Agents：A2A 协议与任务式通信

随着企业内部 Agent 数量增长，点对点自定义集成会变成“集成地狱”
白皮书提出 Agent2Agent (A2A) 协议：

每个 Agent 发布一个包含能力与入口的 Agent Card（数字名片）
统一发现与认证方式，使 Agent 能够互相调用
交互以“任务”为单位，而非单次请求响应
支持长时间运行任务与流式状态更新

这为 Level 3 多 Agent 系统提供了基础设施。

3. Agents & Money：为 Agent 经济搭建可信支付层

当 Agent 可以代表人类做购买与交易时，问题变成：

“如果 Agent 买错了，责任在谁？”

白皮书提出两条关键路径：

AP2（Agent Payments Protocol）

通过加密签名的“Mandate（授权书）”表达用户意图
为每笔交易建立不可抵赖的审计链路
让 Agent 能在明确授权下自主浏览、谈判和交易

x402 协议

基于 HTTP 402（Payment Required）状态码的互联网支付协议
支持机器对机器的微支付，如按调用付费访问 API 或数字内容

两者共同构成了未来 Agentic Web 的“信任与结算层”。

posted @ 2025-12-13 14:08 Eric zhou 阅读(57) 评论(0) 收藏举报

刷新页面返回顶部