某中心发布云端浏览器工具AgentCore,赋能AI网页交互

某中心发布AgentCore云端浏览器工具

在某机构2025纽约峰会上,某机构云服务(AWS)宣布推出Amazon Bedrock AgentCore浏览器工具的预览版。该工具作为完全托管的云端浏览器,使生成式AI代理能够无缝与网站交互,解决两大核心问题:基础模型依赖静态训练数据而缺乏实时信息获取能力;企业在规模化部署AI网页自动化时面临的技术挑战。

技术背景与价值

AgentCore浏览器工具专为多步骤复杂任务设计,提供以下关键能力:

  • 动态数据获取:突破API限制,直接从网页获取实时数据
  • 规模化部署:支持数千并发会话的企业级自动化需求
  • 基础设施托管:消除自建浏览器集群的管理负担

典型应用场景包括:

  1. 重复性任务自动化:表单填写、数据提取、内容预审
  2. 智能研究助手:价格监控、舆情分析、知识库更新
  3. 跨系统工作流:多SaaS系统集成、供应链可视化
  4. 测试验证:跨设备兼容性测试、持续性监控
  5. 遗留系统对接:无API旧系统的数据提取

核心技术特性

网页交互能力

  • 完整导航控制(含多页流程)
  • JavaScript富应用支持
  • 表单操作(文本/下拉/文件上传)
  • 拟人化交互(滚动/悬停/点击)

无服务器架构

  • 自动扩缩容(单会话至数千并发)
  • 全球部署选项
  • 按用量计费模式

视觉理解

  • 全页面截图分析
  • 视觉元素定位
  • 图形内容提取
  • 分辨率/设备模拟

企业级安全

  • 会话隔离机制
  • IAM访问控制
  • 临时会话销毁

开发支持

# Playwright集成示例
from bedrock_agentcore.tools.browser_client import browser_session

with browser_session('us-west-2') as client:
    ws_url, headers = client.generate_ws_headers()
    # 建立浏览器连接...
    page.goto("https://example.com")

技术实现路径

AI代理通过以下流程驱动浏览器:

  1. 用户输入自然语言指令(如"搜索某商品")
  2. 代理框架(如Nova Act)将指令转换为结构化命令
  3. 通过WebSocket安全连接执行浏览器操作
  4. 返回页面响应及截图供AI进一步分析

部署要求

  • Python 3.10+环境
  • IAM权限配置
  • 可选可视化组件BrowserViewerServer
# 快速启动命令
git clone https://github.com/awslabs/amazon-bedrock-agentcore-samples.git
pip install bedrock-agentcore

计费模式

  • 按秒计费(CPU/内存峰值计量)
  • 预览期免费(截至2025年9月16日)
  • 128MB内存起计

该工具现已开放使用,技术文档详见某机构云服务官方开发者指南。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码

posted @ 2025-08-10 14:03  CodeShare  阅读(4)  评论(0)    收藏  举报