OpenAI 模型正式登陆 Amazon Bedrock:GPT-5.5、Codex 和 Managed Agents 实测体验

GPT-5.5 能在亚马逊云科技上跑了。

这不是小道消息。4 月 28 日,亚马逊云科技官宣了三个新产品的 Limited Preview:OpenAI 最新前沿模型、Codex 编码代理、以及 Managed Agents。全部通过 Amazon Bedrock 统一 API 访问。

我第一反应是:终于不用维护两套 SDK 了。

为什么这件事重要

做 AI 应用的开发者都有个痛点——模型选择和基础设施绑定。想用某个模型,就得去对应平台注册账号、配置密钥、处理计费逻辑。项目里同时用三四个模型提供商的情况很常见,每加一个都是额外运维负担。

现在 OpenAI 的模型直接进了 Bedrock。这意味着:

  • 用同一套 IAM 权限管模型访问
  • 同一套 PrivateLink 保障网络隔离
  • 同一套 CloudTrail 追踪调用日志
  • 用量还能算进已有的 AWS 云承诺消费

不需要额外注册任何东西。你现在的 Bedrock 代码,换个 model ID 就能调 GPT-5.5。

三个产品分别是什么

1. OpenAI 前沿模型

GPT-5.4 和 GPT-5.5 直接通过 Bedrock InvokeModel API 调用。支持的企业级控制全部继承——Guardrails 内容过滤、数据加密、VPC 内网访问。

实际调用长这样:

import boto3
import json

bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')

response = bedrock.invoke_model(
    modelId='openai.gpt-5-5',
    contentType='application/json',
    body=json.dumps({
        "messages": [
            {"role": "user", "content": "用 Python 写一个 S3 文件版本对比工具"}
        ],
        "max_tokens": 2048,
        "temperature": 0.7
    })
)

result = json.loads(response['body'].read())
print(result['choices'][0]['message']['content'])

没有新 SDK,没有新认证流程。boto3 一把梭。

2. Codex 编码代理

Codex 是 OpenAI 的代码生成专用模型,现在通过 Bedrock 认证后可以直接用。支持三种入口:

  • Codex CLI — 命令行直接问
  • 桌面应用 — 独立客户端
  • VS Code 扩展 — 编辑器内嵌

关键点:认证走 AWS credentials。不需要单独的 API key。

# 配置好 AWS 凭证后直接用
export AWS_PROFILE=my-dev-profile
codex "重构这个函数,加上错误重试和指数退避"

对于企业团队来说,这解决了一个老大难问题——代码生成工具的权限管控。以前每个开发者都要申请独立 API key,现在统一走 IAM,谁能用什么模型、每月额度多少,全在 IAM policy 里控制。

3. Managed Agents

这是我觉得最有意思的部分。Managed Agents 是 OpenAI 的 agent harness 跑在 Bedrock 上的托管版本。

核心特点:

  • 每个 Agent 有独立身份(IAM Role)
  • 每个动作都有日志记录
  • 运行在你自己的环境里(不是 OpenAI 的服务器)
  • 底层用 Bedrock AgentCore 提供计算环境
import boto3

bedrock_agent = boto3.client('bedrock-agent-runtime')

response = bedrock_agent.invoke_agent(
    agentId='openai-managed-agent-001',
    agentAliasId='LIVE',
    sessionId='session-123',
    inputText='分析过去 7 天的 CloudWatch 告警,找出重复模式并建议合并规则'
)

for event in response['completion']:
    if 'chunk' in event:
        print(event['chunk']['bytes'].decode())

Agent 跑的是长任务——比如"帮我分析日志找根因"或者"自动修复这个 CI 管道"。传统的单次推理做不了这种事。

实际场景怎么用

场景一:多模型对比评估

做 RAG 应用时,我经常需要对比不同模型的回答质量。以前要分别调 Anthropic API 和 OpenAI API,现在全在 Bedrock 里:

models = ['anthropic.claude-opus-4', 'openai.gpt-5-5', 'amazon.nova-pro-v1:0']

for model in models:
    response = bedrock.invoke_model(modelId=model, body=prompt_body)
    # 统一格式,统一计费,统一日志

场景二:Codex + SageMaker 联动

团队里的数据科学家在 SageMaker Notebook 里工作,现在可以直接用 Codex 生成数据处理代码:

# SageMaker Notebook 里
from sagemaker.session import Session

# Codex 帮你写 Feature Engineering 代码
# 生成的代码直接在 SageMaker Processing Job 里跑

场景三:Managed Agents 做运维自动化

设置一个 Agent 专门处理告警:

  1. CloudWatch 告警触发 → EventBridge 规则
  2. 调用 Managed Agent → 分析告警上下文
  3. Agent 自动执行诊断步骤
  4. 生成报告 + 建议修复方案

这个流程以前要写一堆 Lambda 函数和 Step Functions。现在一个 Agent 搞定。

权限和安全

企业最关心的永远是安全。几个关键点:

  1. 数据不出你的 VPC — PrivateLink 端点,流量不走公网
  2. Guardrails 生效 — 你设置的内容过滤规则对 OpenAI 模型同样有效
  3. CloudTrail 全记录 — 谁调了什么模型、什么时间、什么参数,全有
  4. 用量可审计 — Cost Explorer 里能看到每个团队的模型消费
{
    "Version": "2012-10-17",
    "Statement": [{
        "Effect": "Allow",
        "Action": "bedrock:InvokeModel",
        "Resource": "arn:aws:bedrock:us-east-1::foundation-model/openai.gpt-5-5",
        "Condition": {
            "StringEquals": {
                "aws:RequestedRegion": "us-east-1"
            }
        }
    }]
}

目前的限制

实话实说,现在还是 Limited Preview 阶段,有些事做不了:

  • 区域限制 — 目前只有 us-east-1 和 us-west-2(Preview 阶段的老传统了)
  • 模型版本 — GPT-5.5 是最新的,但不是所有变体都有
  • Managed Agents — 还不支持自定义工具接入(只有预置工具集)
  • 配额 — Preview 阶段 TPM(tokens per minute)上限比 GA 低不少

要申请 Preview 访问权限:

aws bedrock get-foundation-model-availability \
    --model-id openai.gpt-5-5 \
    --region us-east-1

如果返回 AVAILABLE,恭喜你已经在白名单里了。

迁移成本有多低

如果你已经在用 Bedrock 调其他模型,迁移成本基本为零。来看个真实例子。

假设你现在的代码是这样的:

# 原来调 Claude
response = bedrock.invoke_model(
    modelId='anthropic.claude-3-5-sonnet-20241022-v2:0',
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 1024
    })
)

换成 GPT-5.5:

# 改成调 GPT-5.5
response = bedrock.invoke_model(
    modelId='openai.gpt-5-5',
    body=json.dumps({
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 1024
    })
)

改动:model ID 换一下,body 格式微调。就这么多。

如果你用的是 Bedrock Converse API(推荐方式),连 body 格式都不用改:

# Converse API — 模型无关
response = bedrock.converse(
    modelId='openai.gpt-5-5',  # 只改这一行
    messages=[{"role": "user", "content": [{"text": prompt}]}],
    inferenceConfig={"maxTokens": 1024, "temperature": 0.7}
)

print(response['output']['message']['content'][0]['text'])

Converse API 是真正的模型抽象层。不管底下跑的是 Claude、GPT 还是 Nova,上层代码一模一样。

和 Guardrails 配合

企业用 AI 模型有个硬需求:内容合规。Bedrock Guardrails 对 OpenAI 模型同样生效。

response = bedrock.invoke_model(
    modelId='openai.gpt-5-5',
    body=json.dumps({...}),
    guardrailIdentifier='my-content-filter',
    guardrailVersion='1'
)

你已有的 Guardrails 策略——比如禁止生成敏感信息、过滤有害内容、屏蔽 PII——直接套用。不需要为 OpenAI 模型单独写一套过滤逻辑。

这对合规团队来说省了大量工作。以前不同模型提供商的安全策略不统一,现在一套规则管所有模型。

成本优化思路

用量可以抵扣 AWS 云承诺消费(EDP/PPA),这个细节别忽略。

意味着什么?如果你公司和亚马逊云科技有年度消费承诺,GPT-5.5 的调用费直接算在里面。不需要额外预算审批去找第三方签合同。

从财务视角看:

  • 一份合同,一个账单
  • 预留折扣可能覆盖模型推理消费
  • Cost Explorer 按团队/项目粒度追踪
  • 设置 Budget Alert 避免超支

我的判断

这件事的意义不在于"又多了一个模型可以选"。

核心变化是:模型层和基础设施层彻底解耦了

以前选模型就是选平台。现在 Bedrock 变成了真正的"模型超市"——Claude、GPT、Nova、Llama 全在一个屋檐下。你的应用代码不需要因为换模型而改架构。

对开发者来说,少维护一套认证体系、少处理一套计费逻辑、少操心一套合规审计。这些都是真实的时间成本。

对企业来说,更重要的是采购简化。一份 AWS 合同覆盖所有模型消费,不需要跟每个模型提供商分别签约。

如果你正在做多模型方案选型,现在是个好时机注册 Preview 试试。


参考资料:

posted @ 2026-05-19 23:50  亚马逊云开发者  阅读(25)  评论(0)    收藏  举报