摘要:
相比于未优化的 vLLM 基线,经过针对性调优的 DeepSeek-V3.2 在 NVIDIA H200 集群上实现了 57.8% 至 153.6% 的吞吐量提升。 阅读全文
相比于未优化的 vLLM 基线,经过针对性调优的 DeepSeek-V3.2 在 NVIDIA H200 集群上实现了 57.8% 至 153.6% 的吞吐量提升。 阅读全文
posted @ 2026-01-06 15:38
GPUStack
阅读(132)
评论(0)
推荐(1)

浙公网安备 33010602011771号