会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
rxg456
博客园
首页
新随笔
联系
订阅
管理
2025年3月26日
kubernetes GPU管理与Device Plugin机制
摘要: 一. kubernetes中如何管理GPU AI基础设施变革: 2016年TensorFlow等框架兴起催生分布式训练需求 云原生场景下GPU管理的核心挑战: 设备隔离性(避免多容器争抢) 驱动兼容性(主机驱动 vs 容器内驱动) 资源可见性(调度器感知设备状态) 以 NVIDIA 的 GPU 设备
阅读全文
posted @ 2025-03-26 22:07 rxg456
阅读(170)
评论(0)
推荐(0)
公告