摘要: DWDP: 在NVL72上的高性能分布式权重数据并行 论文原文 DWDP: Distributed Weight Data Parallelism for High-Performance LLM Inference on NVL72 TensorRT-LLM PR#12136 代码 TensorR 阅读全文
posted @ 2026-04-05 22:18 木木ちゃん 阅读(98) 评论(0) 推荐(0)