摘要: 上文使用koordinator演示gang-scheduling和binpack调度, 已经生效。 4个2卡Pod龟缩在一个节点,另外一个2卡Pod被挤到另外一个节点(每节点上虚拟gpu:8卡)。 此时我们再尝试申请8卡作业,pod会Pending状态。但一旦节点有资源,pod就会自动进入Runni 阅读全文
posted @ 2025-12-15 10:29 码甲哥不卷 阅读(185) 评论(0) 推荐(0)