摘要: 阿里云的ACCL(Alibaba Cloud Collective Communication Library)是一个高性能的集合通信库,主要用于大规模分布式深度学习训练场景中的GPU间通信。它并非从零构建,而是在NVIDIA NCCL(NVIDIA Collective Communication 阅读全文
posted @ 2025-10-21 17:27 rebeca8 阅读(15) 评论(0) 推荐(0)
摘要: 腾讯的 TCCL(Tencent Collective Communication Library)和阿里云的 ACCL(Alibaba Collective Communication Library)都是各自云厂商为应对大规模 AI 模型训练场景,基于或参考 NVIDIA NCCL 构建的高性能 阅读全文
posted @ 2025-10-21 17:26 rebeca8 阅读(7) 评论(0) 推荐(0)