OpenAI 模型正式登陆 Amazon Bedrock:GPT-5.5、Codex 和 Managed Agents 实测体验
GPT-5.5 能在亚马逊云科技上跑了。
这不是小道消息。4 月 28 日,亚马逊云科技官宣了三个新产品的 Limited Preview:OpenAI 最新前沿模型、Codex 编码代理、以及 Managed Agents。全部通过 Amazon Bedrock 统一 API 访问。
我第一反应是:终于不用维护两套 SDK 了。
为什么这件事重要
做 AI 应用的开发者都有个痛点——模型选择和基础设施绑定。想用某个模型,就得去对应平台注册账号、配置密钥、处理计费逻辑。项目里同时用三四个模型提供商的情况很常见,每加一个都是额外运维负担。
现在 OpenAI 的模型直接进了 Bedrock。这意味着:
- 用同一套 IAM 权限管模型访问
- 同一套 PrivateLink 保障网络隔离
- 同一套 CloudTrail 追踪调用日志
- 用量还能算进已有的 AWS 云承诺消费
不需要额外注册任何东西。你现在的 Bedrock 代码,换个 model ID 就能调 GPT-5.5。
三个产品分别是什么
1. OpenAI 前沿模型
GPT-5.4 和 GPT-5.5 直接通过 Bedrock InvokeModel API 调用。支持的企业级控制全部继承——Guardrails 内容过滤、数据加密、VPC 内网访问。
实际调用长这样:
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
response = bedrock.invoke_model(
modelId='openai.gpt-5-5',
contentType='application/json',
body=json.dumps({
"messages": [
{"role": "user", "content": "用 Python 写一个 S3 文件版本对比工具"}
],
"max_tokens": 2048,
"temperature": 0.7
})
)
result = json.loads(response['body'].read())
print(result['choices'][0]['message']['content'])
没有新 SDK,没有新认证流程。boto3 一把梭。
2. Codex 编码代理
Codex 是 OpenAI 的代码生成专用模型,现在通过 Bedrock 认证后可以直接用。支持三种入口:
- Codex CLI — 命令行直接问
- 桌面应用 — 独立客户端
- VS Code 扩展 — 编辑器内嵌
关键点:认证走 AWS credentials。不需要单独的 API key。
# 配置好 AWS 凭证后直接用
export AWS_PROFILE=my-dev-profile
codex "重构这个函数,加上错误重试和指数退避"
对于企业团队来说,这解决了一个老大难问题——代码生成工具的权限管控。以前每个开发者都要申请独立 API key,现在统一走 IAM,谁能用什么模型、每月额度多少,全在 IAM policy 里控制。
3. Managed Agents
这是我觉得最有意思的部分。Managed Agents 是 OpenAI 的 agent harness 跑在 Bedrock 上的托管版本。
核心特点:
- 每个 Agent 有独立身份(IAM Role)
- 每个动作都有日志记录
- 运行在你自己的环境里(不是 OpenAI 的服务器)
- 底层用 Bedrock AgentCore 提供计算环境
import boto3
bedrock_agent = boto3.client('bedrock-agent-runtime')
response = bedrock_agent.invoke_agent(
agentId='openai-managed-agent-001',
agentAliasId='LIVE',
sessionId='session-123',
inputText='分析过去 7 天的 CloudWatch 告警,找出重复模式并建议合并规则'
)
for event in response['completion']:
if 'chunk' in event:
print(event['chunk']['bytes'].decode())
Agent 跑的是长任务——比如"帮我分析日志找根因"或者"自动修复这个 CI 管道"。传统的单次推理做不了这种事。
实际场景怎么用
场景一:多模型对比评估
做 RAG 应用时,我经常需要对比不同模型的回答质量。以前要分别调 Anthropic API 和 OpenAI API,现在全在 Bedrock 里:
models = ['anthropic.claude-opus-4', 'openai.gpt-5-5', 'amazon.nova-pro-v1:0']
for model in models:
response = bedrock.invoke_model(modelId=model, body=prompt_body)
# 统一格式,统一计费,统一日志
场景二:Codex + SageMaker 联动
团队里的数据科学家在 SageMaker Notebook 里工作,现在可以直接用 Codex 生成数据处理代码:
# SageMaker Notebook 里
from sagemaker.session import Session
# Codex 帮你写 Feature Engineering 代码
# 生成的代码直接在 SageMaker Processing Job 里跑
场景三:Managed Agents 做运维自动化
设置一个 Agent 专门处理告警:
- CloudWatch 告警触发 → EventBridge 规则
- 调用 Managed Agent → 分析告警上下文
- Agent 自动执行诊断步骤
- 生成报告 + 建议修复方案
这个流程以前要写一堆 Lambda 函数和 Step Functions。现在一个 Agent 搞定。
权限和安全
企业最关心的永远是安全。几个关键点:
- 数据不出你的 VPC — PrivateLink 端点,流量不走公网
- Guardrails 生效 — 你设置的内容过滤规则对 OpenAI 模型同样有效
- CloudTrail 全记录 — 谁调了什么模型、什么时间、什么参数,全有
- 用量可审计 — Cost Explorer 里能看到每个团队的模型消费
{
"Version": "2012-10-17",
"Statement": [{
"Effect": "Allow",
"Action": "bedrock:InvokeModel",
"Resource": "arn:aws:bedrock:us-east-1::foundation-model/openai.gpt-5-5",
"Condition": {
"StringEquals": {
"aws:RequestedRegion": "us-east-1"
}
}
}]
}
目前的限制
实话实说,现在还是 Limited Preview 阶段,有些事做不了:
- 区域限制 — 目前只有 us-east-1 和 us-west-2(Preview 阶段的老传统了)
- 模型版本 — GPT-5.5 是最新的,但不是所有变体都有
- Managed Agents — 还不支持自定义工具接入(只有预置工具集)
- 配额 — Preview 阶段 TPM(tokens per minute)上限比 GA 低不少
要申请 Preview 访问权限:
aws bedrock get-foundation-model-availability \
--model-id openai.gpt-5-5 \
--region us-east-1
如果返回 AVAILABLE,恭喜你已经在白名单里了。
迁移成本有多低
如果你已经在用 Bedrock 调其他模型,迁移成本基本为零。来看个真实例子。
假设你现在的代码是这样的:
# 原来调 Claude
response = bedrock.invoke_model(
modelId='anthropic.claude-3-5-sonnet-20241022-v2:0',
body=json.dumps({
"anthropic_version": "bedrock-2023-05-31",
"messages": [{"role": "user", "content": prompt}],
"max_tokens": 1024
})
)
换成 GPT-5.5:
# 改成调 GPT-5.5
response = bedrock.invoke_model(
modelId='openai.gpt-5-5',
body=json.dumps({
"messages": [{"role": "user", "content": prompt}],
"max_tokens": 1024
})
)
改动:model ID 换一下,body 格式微调。就这么多。
如果你用的是 Bedrock Converse API(推荐方式),连 body 格式都不用改:
# Converse API — 模型无关
response = bedrock.converse(
modelId='openai.gpt-5-5', # 只改这一行
messages=[{"role": "user", "content": [{"text": prompt}]}],
inferenceConfig={"maxTokens": 1024, "temperature": 0.7}
)
print(response['output']['message']['content'][0]['text'])
Converse API 是真正的模型抽象层。不管底下跑的是 Claude、GPT 还是 Nova,上层代码一模一样。
和 Guardrails 配合
企业用 AI 模型有个硬需求:内容合规。Bedrock Guardrails 对 OpenAI 模型同样生效。
response = bedrock.invoke_model(
modelId='openai.gpt-5-5',
body=json.dumps({...}),
guardrailIdentifier='my-content-filter',
guardrailVersion='1'
)
你已有的 Guardrails 策略——比如禁止生成敏感信息、过滤有害内容、屏蔽 PII——直接套用。不需要为 OpenAI 模型单独写一套过滤逻辑。
这对合规团队来说省了大量工作。以前不同模型提供商的安全策略不统一,现在一套规则管所有模型。
成本优化思路
用量可以抵扣 AWS 云承诺消费(EDP/PPA),这个细节别忽略。
意味着什么?如果你公司和亚马逊云科技有年度消费承诺,GPT-5.5 的调用费直接算在里面。不需要额外预算审批去找第三方签合同。
从财务视角看:
- 一份合同,一个账单
- 预留折扣可能覆盖模型推理消费
- Cost Explorer 按团队/项目粒度追踪
- 设置 Budget Alert 避免超支
我的判断
这件事的意义不在于"又多了一个模型可以选"。
核心变化是:模型层和基础设施层彻底解耦了。
以前选模型就是选平台。现在 Bedrock 变成了真正的"模型超市"——Claude、GPT、Nova、Llama 全在一个屋檐下。你的应用代码不需要因为换模型而改架构。
对开发者来说,少维护一套认证体系、少处理一套计费逻辑、少操心一套合规审计。这些都是真实的时间成本。
对企业来说,更重要的是采购简化。一份 AWS 合同覆盖所有模型消费,不需要跟每个模型提供商分别签约。
如果你正在做多模型方案选型,现在是个好时机注册 Preview 试试。
参考资料:

浙公网安备 33010602011771号