华为CloudMatrix384 超节点的网络架构设计 - 指南
华为CloudMatrix384 超节点硬件介绍
CloudMatrix384 被设计为一个 AI 超级节点,集成了 384 个昇腾 910C 算力芯片(华为称为:NPU),和 192 个鲲鹏CPU。

1、6+6的12个昇腾计算柜
计算柜是超节点的基础单元,具有超节点架构、多档位配备等特点。支持大规模,高性能AI训练和推理业务,可应用于人工智算中心,区域高性能计算,互联网,云数据中心AI算力等重算力场景。当组网不涉及总线设备柜,计算柜就是Atlas 900 A3 SuperPoD 超节点。

2、48台910C服务器(单台服务器包含8张910C卡、4张鲲鹏cpu、1个擎天卡、7台L1交换机)
基于华为自研鲲鹏920处理器、昇腾910 AI处理器、交换芯片和CDR(Clock and Data Recovery,主要用于扩展信号传输距离,保障信号传输质量)芯片的AI计算节点,满足行业智算中心、大企业和华为云等高性能、高能效液冷训练集群的需求,提供业界AI最佳集群方案,以算力、网络和集成度业界领先为目标,结合工程优势持续构筑AI集群硬件竞争力。就是计算节点


3、4个总线设备柜
总线设备柜是超节点的总线基础单元,具有支持集中供电、灵活配置等特点。可应用于人工智算中心、区域高性能计算、互联网、云数据中心AI算力等重算力场景的超节点灵衢网络平面连接。

4、56台L2交换机(14台*4柜)
LingQu 630 V1是一款灵衢总线交换设备,为计算节点给予高速网络连接,通过与各个模块互联实现内部数据报文和控制管理报文的交换,为用户给予高速数据传输,对外提供48个QSFP-DD(48*2*200G,LQC)接口,具有高性能、高带宽、低延迟等特点
- 两个交换芯片分别出一个200G到每个端口组成一个400G QSFP-DD端口。
- 电源使用标准一次电源模块,支持220AC/240DC、±48V输入。
- LingQu 630 V1最大功耗为1200W

浙公网安备 33010602011771号