摘要:
阿里云的ACCL(Alibaba Cloud Collective Communication Library)是一个高性能的集合通信库,主要用于大规模分布式深度学习训练场景中的GPU间通信。它并非从零构建,而是在NVIDIA NCCL(NVIDIA Collective Communication 阅读全文
posted @ 2025-10-21 17:27
rebeca8
阅读(15)
评论(0)
推荐(0)
摘要:
腾讯的 TCCL(Tencent Collective Communication Library)和阿里云的 ACCL(Alibaba Collective Communication Library)都是各自云厂商为应对大规模 AI 模型训练场景,基于或参考 NVIDIA NCCL 构建的高性能 阅读全文
posted @ 2025-10-21 17:26
rebeca8
阅读(7)
评论(0)
推荐(0)
浙公网安备 33010602011771号