Graviton5 正式发布:M9g 实例实测数据出炉,ClickHouse 性能提升 36%

Graviton5 正式发布:M9g 实例实测数据出炉,ClickHouse 性能提升 36%

刷到一条大消息——Graviton5 驱动的 M9g 和 M9gd 实例今天正式 GA 了。

去年 re:Invent 2025 发了预览版,半年过去了,几家大厂跑完了生产级测试,数据挺猛的:

  • ClickHouse:比 M8g 性能提升 36%,零代码改动
  • Honeycomb:6 个月 A/B 测试,每核吞吐比 Graviton4 高 36%
  • HubSpot:MySQL 查询延迟降低了 60%
  • Meta:正在用数千万核 Graviton 跑 Agentic AI 工作负载

这些不是实验室数据,是生产环境的实测结果。我来拆解一下这代芯片到底强在哪。

硬件规格升级

参数 Graviton4 (M8g) Graviton5 (M9g) 变化
核心数 96 192 2x
L3 缓存 标准 5x 更大 大幅提升
核间延迟 标准 降低 33% 对多线程友好
内存 DDR5 DDR5(更高带宽) 吞吐提升
Nitro 系统 第5代 第6代 网络/存储更快

192 核 + 5 倍 L3 缓存 + 33% 更低核间延迟,这三个参数叠在一起对数据库和高并发场景的提升非常明显。

为什么 AI Agent 场景需要强 CPU

很多人以为 AI 就是 GPU 的事。但 Agentic AI 工作负载——实时推理、代码生成、多步骤任务编排——实际上非常吃 CPU:

  1. Agent 编排层:调用工具、处理结果、决策下一步,全是 CPU 密集
  2. 并发环境管理:一个 Agent 可能同时操作多个沙箱环境
  3. 数据预处理:从数据库拉数据、序列化/反序列化 JSON、做文本处理
  4. 等待优化:核间延迟低 → Agent 的每一步决策更快

Meta 选择用 Graviton 跑 Agentic AI 不是偶然——这类工作负载的特点就是高并发、多线程、延迟敏感。

实例选型

M9g 和 M9gd 的区别:

实例族 特点 适合场景
M9g 通用型,EBS 存储 Web 服务、微服务、应用服务器
M9gd 带本地 NVMe SSD 数据库、缓存、需要高 IOPS 的场景

规格范围(预计与 M8g 类似):

m9g.medium    → 1 vCPU,  4 GiB
m9g.large     → 2 vCPU,  8 GiB
m9g.xlarge    → 4 vCPU, 16 GiB
m9g.2xlarge   → 8 vCPU, 32 GiB
...
m9g.metal-192xl → 192 vCPU, 768 GiB

迁移评估

如果你现在跑在 M7g/M8g 上,迁移到 M9g 基本是无缝的——同样是 Arm64 架构,只要你的应用已经跑在 Graviton 上,换实例类型就行。

如果你还在 x86 上:

# 检查当前架构
uname -m
# x86_64 → 需要评估迁移
# aarch64 → 直接换实例类型

# 对于容器化应用,构建多架构镜像
docker buildx build --platform linux/amd64,linux/arm64 -t myapp:latest .

关键检查项:

  1. 原生依赖:看有没有只有 x86 预编译包的库(ldd 检查 .so 文件)
  2. 容器基础镜像:确认用的是多架构镜像(官方 Docker Hub 镜像基本都支持)
  3. 编译选项:如果有 C/C++ 扩展,去掉 -march=x86-64 等硬编码

大部分 Java/Python/Node.js 应用迁移到 Graviton 不需要改代码。主要踩坑点在 C 扩展和 SIMD 指令。

用 Boto3 启动 M9g 实例

import boto3

ec2 = boto3.client("ec2", region_name="us-east-1")

# 查找最新的 Amazon Linux 2023 ARM64 AMI
response = ec2.describe_images(
    Owners=["amazon"],
    Filters=[
        {"Name": "name", "Values": ["al2023-ami-2023.*-arm64"]},
        {"Name": "architecture", "Values": ["arm64"]},
        {"Name": "state", "Values": ["available"]}
    ]
)

# 按创建日期排序取最新的
images = sorted(response["Images"], key=lambda x: x["CreationDate"], reverse=True)
ami_id = images[0]["ImageId"]

# 启动 M9g 实例
instance = ec2.run_instances(
    ImageId=ami_id,
    InstanceType="m9g.xlarge",
    MinCount=1,
    MaxCount=1,
    KeyName="my-key-pair",
    SecurityGroupIds=["sg-0123456789abcdef0"],
    SubnetId="subnet-0123456789abcdef0",
    TagSpecifications=[
        {
            "ResourceType": "instance",
            "Tags": [{"Key": "Name", "Value": "graviton5-test"}]
        }
    ]
)

instance_id = instance["Instances"][0]["InstanceId"]
print(f"Launched M9g instance: {instance_id}")

性价比估算

按照 AWS 定价惯例,同规格 Graviton 实例比 Intel/AMD 便宜约 20%。如果 M9g 比 M8g 性能高 36%(ClickHouse 数据),加上价格可能持平或略涨:

  • 假设 M9g 价格 = M8g × 1.05(通常新一代略贵 5%)
  • 性能提升 36%
  • 性价比提升约 30%

对于 CPU 密集型工作负载,换代的 ROI 很明显。

可用区域

M9g 今天在以下区域 GA:

  • 美东(弗吉尼亚)us-east-1
  • 美西(俄勒冈)us-west-2
  • 欧洲(爱尔兰)eu-west-1

其他区域预计后续几周陆续开放。

参考链接

posted @ 2026-06-11 08:05  亚马逊云开发者  阅读(18)  评论(0)    收藏  举报