铜缆的极限传输速率不是200Gbps,目前800G(8通道PAM4(112Gbps)),224Gbps/Lane也在落地中

这是一个常见的误解或信息混淆。我们来澄清几个关键点:


❌ 错误前提澄清

“铜缆的物理传输速率极限是200Gbps,提出者:NVIDIA Megatron-LM(2019)” —— 这个说法不成立。

原因如下:

1. Megatron-LM(2019)是一篇关于大模型训练的论文,不研究物理层通信

  • Megatron-LM 由 NVIDIA 在 2019 年提出,核心贡献是:
    • 引入 张量并行(Tensor Parallelism) 训练超大 Transformer 模型;
    • 实现了高效的模型并行策略;
    • 并未涉及铜缆、物理传输介质、通信硬件或速率极限的物理研究
  • 它关注的是算法与分布式训练架构,而非物理层(PHY)或互连技术。

2. 铜缆的速率极限并非固定为 200Gbps

  • 铜缆(尤其是高速 DAC / ACC / AEC)的速率极限取决于多个因素
    • 线缆长度
    • 信号调制方式(NRZ / PAM4)
    • 是否使用 Retimer(有源 vs 无源)
    • 材料与制造工艺(如发泡绝缘、镀银导体)
    • 连接器与背板设计

事实举例

  • 800G DAC/AEC 铜缆已在 2023–2025 年量产(如博创科技、兆龙互联、安费诺);
  • 单通道速率已达 112Gbps(PAM4),8通道即可实现 800G;
  • 224Gbps/lane(PAM4)铜缆正在研发或小批量试产(如安费诺、Molex、沃尔核材);
  • NVIDIA GB200 NVL72 系统内部大量使用铜缆,总带宽远超 200Gbps/链路。

📌 因此,“200Gbps 是铜缆极限” 是过时或片面的说法。更准确的说法是:

  • 无源铜缆(DAC)在 2–3 米距离内,实用速率上限约为 200Gbps(~56Gbps × 4 lanes)
  • 有源铜缆(AEC/ACC)通过 Retimer 可突破此限制,达到 800G 甚至 1.6T(短距)

🔍 那么,“200Gbps 铜缆极限”说法从何而来?

可能源于以下背景:

✅ 背景 1:早期无源 DAC 的工程限制(约 2018–2020)

  • 在 100G–200G 时代,数据中心广泛使用 QSFP28 DAC(100G,4×25G NRZ);
  • 当尝试升级到 400G DAC(4×100G PAM4) 时,发现:
    • 超过 2 米后信号衰减严重;
    • 插入损耗、串扰、码间干扰(ISI)导致误码率上升;
    • 无源铜缆难以稳定支持 400G 长距离传输。
  • 因此,行业共识是:无源铜缆在实用场景中“经济可行”的上限约为 200G(或 400G@1m)

✅ 背景 2:NVIDIA 或其他厂商在内部文档中提及“铜缆用于短距 <200G”

  • 在某些架构设计文档中(如早期 DGX 系统),为保证稳定性,限制机柜内铜缆用于 ≤200G 场景
  • 但这是一种工程折衷,而非物理极限。

📈 当前铜缆速率能力(截至 2025)

类型单通道速率总速率(典型)距离是否量产
DAC(无源) 56Gbps (PAM4) 200G / 400G ≤2m
AEC(有源) 112Gbps (PAM4) 800G ≤3m ✅(Credo、Marvell Retimer)
实验级铜缆 224Gbps (PAM4) 1.6T ≤1m 🧪(安费诺、Molex)

💡 NVIDIA GB200 系统中,单根 NVLink 铜缆可达 100+ Gbps/lane,整机使用数千根铜缆,总带宽达 数十 TB/s


✅ 正确结论

  1. NVIDIA Megatron-LM(2019)从未提出“铜缆速率极限为 200Gbps”
  2. 200Gbps 是早期无源铜缆在实用距离下的工程上限,非物理极限
  3. 现代有源铜缆(AEC)已突破 800G,224G/lane 技术正在落地
  4. 铜缆 vs 光纤的选择,核心是“成本-功耗-距离-带宽”权衡,而非绝对速率天花板

如果你看到某份资料将“200Gbps 铜缆极限”归因于 Megatron-LM,那很可能是张冠李戴二手信息误传。建议以 IEEE、OIF、NVIDIA GTC 技术白皮书或头部连接器厂商(如 Amphenol、Molex)的官方数据为准。

posted @ 2025-10-30 15:59  rebeca8  阅读(15)  评论(0)    收藏  举报