OpenAI 模型正式登陆 Amazon Bedrock：GPT-5.5、Codex 和 Managed Agents 实测体验

GPT-5.5 能在亚马逊云科技上跑了。

这不是小道消息。4 月 28 日，亚马逊云科技官宣了三个新产品的 Limited Preview：OpenAI 最新前沿模型、Codex 编码代理、以及 Managed Agents。全部通过 Amazon Bedrock 统一 API 访问。

我第一反应是：终于不用维护两套 SDK 了。

为什么这件事重要

做 AI 应用的开发者都有个痛点——模型选择和基础设施绑定。想用某个模型，就得去对应平台注册账号、配置密钥、处理计费逻辑。项目里同时用三四个模型提供商的情况很常见，每加一个都是额外运维负担。

现在 OpenAI 的模型直接进了 Bedrock。这意味着：

用同一套 IAM 权限管模型访问
同一套 PrivateLink 保障网络隔离
同一套 CloudTrail 追踪调用日志
用量还能算进已有的 AWS 云承诺消费

不需要额外注册任何东西。你现在的 Bedrock 代码，换个 model ID 就能调 GPT-5.5。

三个产品分别是什么

1. OpenAI 前沿模型

GPT-5.4 和 GPT-5.5 直接通过 Bedrock InvokeModel API 调用。支持的企业级控制全部继承——Guardrails 内容过滤、数据加密、VPC 内网访问。

实际调用长这样：

import boto3
import json

bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')

response = bedrock.invoke_model(
    modelId='openai.gpt-5-5',
    contentType='application/json',
    body=json.dumps({
        "messages": [
            {"role": "user", "content": "用 Python 写一个 S3 文件版本对比工具"}
        ],
        "max_tokens": 2048,
        "temperature": 0.7
    })
)

result = json.loads(response['body'].read())
print(result['choices'][0]['message']['content'])

没有新 SDK，没有新认证流程。boto3 一把梭。

2. Codex 编码代理

Codex 是 OpenAI 的代码生成专用模型，现在通过 Bedrock 认证后可以直接用。支持三种入口：

Codex CLI — 命令行直接问
桌面应用 — 独立客户端
VS Code 扩展 — 编辑器内嵌

关键点：认证走 AWS credentials。不需要单独的 API key。

# 配置好 AWS 凭证后直接用
export AWS_PROFILE=my-dev-profile
codex "重构这个函数，加上错误重试和指数退避"

对于企业团队来说，这解决了一个老大难问题——代码生成工具的权限管控。以前每个开发者都要申请独立 API key，现在统一走 IAM，谁能用什么模型、每月额度多少，全在 IAM policy 里控制。

3. Managed Agents

这是我觉得最有意思的部分。Managed Agents 是 OpenAI 的 agent harness 跑在 Bedrock 上的托管版本。

核心特点：

每个 Agent 有独立身份（IAM Role）
每个动作都有日志记录
运行在你自己的环境里（不是 OpenAI 的服务器）
底层用 Bedrock AgentCore 提供计算环境

import boto3

bedrock_agent = boto3.client('bedrock-agent-runtime')

response = bedrock_agent.invoke_agent(
    agentId='openai-managed-agent-001',
    agentAliasId='LIVE',
    sessionId='session-123',
    inputText='分析过去 7 天的 CloudWatch 告警，找出重复模式并建议合并规则'
)

for event in response['completion']:
    if 'chunk' in event:
        print(event['chunk']['bytes'].decode())

Agent 跑的是长任务——比如"帮我分析日志找根因"或者"自动修复这个 CI 管道"。传统的单次推理做不了这种事。

实际场景怎么用

场景一：多模型对比评估

做 RAG 应用时，我经常需要对比不同模型的回答质量。以前要分别调 Anthropic API 和 OpenAI API，现在全在 Bedrock 里：

models = ['anthropic.claude-opus-4', 'openai.gpt-5-5', 'amazon.nova-pro-v1:0']

for model in models:
    response = bedrock.invoke_model(modelId=model, body=prompt_body)
    # 统一格式，统一计费，统一日志

场景二：Codex + SageMaker 联动

团队里的数据科学家在 SageMaker Notebook 里工作，现在可以直接用 Codex 生成数据处理代码：

# SageMaker Notebook 里
from sagemaker.session import Session

# Codex 帮你写 Feature Engineering 代码
# 生成的代码直接在 SageMaker Processing Job 里跑

场景三：Managed Agents 做运维自动化

设置一个 Agent 专门处理告警：

CloudWatch 告警触发 → EventBridge 规则
调用 Managed Agent → 分析告警上下文
Agent 自动执行诊断步骤
生成报告 + 建议修复方案

这个流程以前要写一堆 Lambda 函数和 Step Functions。现在一个 Agent 搞定。

权限和安全

企业最关心的永远是安全。几个关键点：

数据不出你的 VPC — PrivateLink 端点，流量不走公网
Guardrails 生效 — 你设置的内容过滤规则对 OpenAI 模型同样有效
CloudTrail 全记录 — 谁调了什么模型、什么时间、什么参数，全有
用量可审计 — Cost Explorer 里能看到每个团队的模型消费

{
    "Version": "2012-10-17",
    "Statement": [{
        "Effect": "Allow",
        "Action": "bedrock:InvokeModel",
        "Resource": "arn:aws:bedrock:us-east-1::foundation-model/openai.gpt-5-5",
        "Condition": {
            "StringEquals": {
                "aws:RequestedRegion": "us-east-1"
            }
        }
    }]
}

目前的限制

实话实说，现在还是 Limited Preview 阶段，有些事做不了：

区域限制 — 目前只有 us-east-1 和 us-west-2（Preview 阶段的老传统了）
模型版本 — GPT-5.5 是最新的，但不是所有变体都有
Managed Agents — 还不支持自定义工具接入（只有预置工具集）
配额 — Preview 阶段 TPM（tokens per minute）上限比 GA 低不少

要申请 Preview 访问权限：

aws bedrock get-foundation-model-availability \
    --model-id openai.gpt-5-5 \
    --region us-east-1

如果返回 AVAILABLE，恭喜你已经在白名单里了。

迁移成本有多低

如果你已经在用 Bedrock 调其他模型，迁移成本基本为零。来看个真实例子。

假设你现在的代码是这样的：

# 原来调 Claude
response = bedrock.invoke_model(
    modelId='anthropic.claude-3-5-sonnet-20241022-v2:0',
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 1024
    })
)

换成 GPT-5.5：

# 改成调 GPT-5.5
response = bedrock.invoke_model(
    modelId='openai.gpt-5-5',
    body=json.dumps({
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 1024
    })
)

改动：model ID 换一下，body 格式微调。就这么多。

如果你用的是 Bedrock Converse API（推荐方式），连 body 格式都不用改：

# Converse API — 模型无关
response = bedrock.converse(
    modelId='openai.gpt-5-5',  # 只改这一行
    messages=[{"role": "user", "content": [{"text": prompt}]}],
    inferenceConfig={"maxTokens": 1024, "temperature": 0.7}
)

print(response['output']['message']['content'][0]['text'])

Converse API 是真正的模型抽象层。不管底下跑的是 Claude、GPT 还是 Nova，上层代码一模一样。

和 Guardrails 配合

企业用 AI 模型有个硬需求：内容合规。Bedrock Guardrails 对 OpenAI 模型同样生效。

response = bedrock.invoke_model(
    modelId='openai.gpt-5-5',
    body=json.dumps({...}),
    guardrailIdentifier='my-content-filter',
    guardrailVersion='1'
)

你已有的 Guardrails 策略——比如禁止生成敏感信息、过滤有害内容、屏蔽 PII——直接套用。不需要为 OpenAI 模型单独写一套过滤逻辑。

这对合规团队来说省了大量工作。以前不同模型提供商的安全策略不统一，现在一套规则管所有模型。

成本优化思路

用量可以抵扣 AWS 云承诺消费（EDP/PPA），这个细节别忽略。

意味着什么？如果你公司和亚马逊云科技有年度消费承诺，GPT-5.5 的调用费直接算在里面。不需要额外预算审批去找第三方签合同。

从财务视角看：

一份合同，一个账单
预留折扣可能覆盖模型推理消费
Cost Explorer 按团队/项目粒度追踪
设置 Budget Alert 避免超支

我的判断

这件事的意义不在于"又多了一个模型可以选"。

核心变化是：模型层和基础设施层彻底解耦了。

以前选模型就是选平台。现在 Bedrock 变成了真正的"模型超市"——Claude、GPT、Nova、Llama 全在一个屋檐下。你的应用代码不需要因为换模型而改架构。

对开发者来说，少维护一套认证体系、少处理一套计费逻辑、少操心一套合规审计。这些都是真实的时间成本。

对企业来说，更重要的是采购简化。一份 AWS 合同覆盖所有模型消费，不需要跟每个模型提供商分别签约。

如果你正在做多模型方案选型，现在是个好时机注册 Preview 试试。

参考资料：

posted @ 2026-05-19 23:50 亚马逊云开发者阅读(25) 评论(0) 收藏举报

刷新页面返回顶部

亚马逊云开发者

进入亚马逊云科技开发者网站，请锁定 https://dev.amazoncloud.cn 帮助开发者学习成长、交流，链接全球资源，助力开发者成功。