07 2025 档案

摘要:上篇我们分析了 hami-webhook,该 Webhook 将申请了 vGPU 资源的 Pod 的调度器修改为 hami-scheduler,后续使用 hami-scheduler 进行调度。 本文为 HAMi 原理分析的第三篇,分析 hami-scheduler 工作流程。 上篇主要分析了 ha 阅读全文
posted @ 2025-07-31 09:25 探索云原生 阅读(328) 评论(0) 推荐(0)
摘要:上篇我们分析了 hami-device-plugin-nvidia,知道了 HAMi 的 NVIDIA device plugin 工作原理。 本文为 HAMi 原理分析的第二篇,分析 hami-scheduler 实现原理。 为了实现基于 vGPU 的调度,HAMi 实现了自己的 Schedule 阅读全文
posted @ 2025-07-24 13:34 探索云原生 阅读(353) 评论(0) 推荐(0)
摘要:本文主要分享如何通过 Scheduler Extender 扩展调度器从而实现自定义调度策略。 1. 为什么需要自定义调度逻辑 什么是所谓的调度? 所谓调度就是指给 Pod 对象的 spec.nodeName 赋值 待调度对象则是所有 spec.nodeName 为空的 Pod 调度过程则是从集群现 阅读全文
posted @ 2025-07-16 13:47 探索云原生 阅读(478) 评论(0) 推荐(0)
摘要:本文为开源的 vGPU 方案 HAMi 实现原理分析第一篇,主要分析 hami-device-plugin-nvidia 实现原理。 之前在 开源 vGPU 方案:HAMi,实现细粒度 GPU 切分 介绍了 HAMi 是什么,然后在开源 vGPU 方案 HAMi: core&memory 隔离测试 阅读全文
posted @ 2025-07-09 09:32 探索云原生 阅读(435) 评论(0) 推荐(0)
摘要:本文主要对开源的 vGPU 方案 HAMi 的 GPU Core&Memory 隔离功能进行测试。 省流: HAMi vGPU 方案提供的 Core&Memory 隔离基本符合预期: Core 隔离:Pod 能使用的算力会围绕设定值波动,但是一段时间内平均下来和申请的 gpucores 基本一致 M 阅读全文
posted @ 2025-07-04 09:14 探索云原生 阅读(359) 评论(0) 推荐(0)