cloudpilot-ai

导航

KCD演讲回顾|高效 AI 基础设施:业务灵活弹性+云端 GPU 瞬时供应

上周六,KCD 北京如约举办,活动现场汇聚了上百位开发者加入这场技术盛宴。

CloudPilot AI 的 Tech Lead 姜伟在 AI 专场以「高效 AI 基础设施:业务灵活弹性+云端 GPU 瞬时供应」为题进行分享,深入解析如何在公有云中结合 KServe 和 Karpenter,打造高性价比的企业级 AI 推理工作负载。


姜伟在 KCD Beijing 演讲现场

演讲内容

本次分享中,主要探讨了:

  • AI 推理基础架构的典型场景和挑战
  • 如何结合 KServe 和 Karpenter 解决复杂性及成本难题
  • 如何利用 Karpenter 按需供应 GPU,以满足不同工作负载的需求

以下为本次演讲 PPT:

















在近期即将在伦敦举办的 KubeCon 2025 上,也有 Karpenter 相关的演讲,将介绍如何通过 Karpenter 自动化 Kubernetes 集群更新,欢迎到现场交流!

推荐阅读

弹性工具选Karpenter还是Cluster Autoscaler?看这篇就知道啦!

劲省85%云成本!在K8s上使用Karpenter私有部署DeepSeek-R1

Prometheus v2.47+Karpenter:轻松月省4万云成本

posted on 2025-03-19 15:36  CloudPilotAI  阅读(29)  评论(0)    收藏  举报