某中心发布云端浏览器工具AgentCore,赋能AI网页交互
某中心发布AgentCore云端浏览器工具
在某机构2025纽约峰会上,某机构云服务(AWS)宣布推出Amazon Bedrock AgentCore浏览器工具的预览版。该工具作为完全托管的云端浏览器,使生成式AI代理能够无缝与网站交互,解决两大核心问题:基础模型依赖静态训练数据而缺乏实时信息获取能力;企业在规模化部署AI网页自动化时面临的技术挑战。
技术背景与价值
AgentCore浏览器工具专为多步骤复杂任务设计,提供以下关键能力:
- 动态数据获取:突破API限制,直接从网页获取实时数据
- 规模化部署:支持数千并发会话的企业级自动化需求
- 基础设施托管:消除自建浏览器集群的管理负担
典型应用场景包括:
- 重复性任务自动化:表单填写、数据提取、内容预审
- 智能研究助手:价格监控、舆情分析、知识库更新
- 跨系统工作流:多SaaS系统集成、供应链可视化
- 测试验证:跨设备兼容性测试、持续性监控
- 遗留系统对接:无API旧系统的数据提取
核心技术特性
网页交互能力
- 完整导航控制(含多页流程)
- JavaScript富应用支持
- 表单操作(文本/下拉/文件上传)
- 拟人化交互(滚动/悬停/点击)
无服务器架构
- 自动扩缩容(单会话至数千并发)
- 全球部署选项
- 按用量计费模式
视觉理解
- 全页面截图分析
- 视觉元素定位
- 图形内容提取
- 分辨率/设备模拟
企业级安全
- 会话隔离机制
- IAM访问控制
- 临时会话销毁
开发支持
# Playwright集成示例
from bedrock_agentcore.tools.browser_client import browser_session
with browser_session('us-west-2') as client:
ws_url, headers = client.generate_ws_headers()
# 建立浏览器连接...
page.goto("https://example.com")
技术实现路径
AI代理通过以下流程驱动浏览器:
- 用户输入自然语言指令(如"搜索某商品")
- 代理框架(如Nova Act)将指令转换为结构化命令
- 通过WebSocket安全连接执行浏览器操作
- 返回页面响应及截图供AI进一步分析
部署要求
- Python 3.10+环境
- IAM权限配置
- 可选可视化组件BrowserViewerServer
# 快速启动命令
git clone https://github.com/awslabs/amazon-bedrock-agentcore-samples.git
pip install bedrock-agentcore
计费模式
- 按秒计费(CPU/内存峰值计量)
- 预览期免费(截至2025年9月16日)
- 128MB内存起计
该工具现已开放使用,技术文档详见某机构云服务官方开发者指南。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码