随笔分类 -  Kubernetes介绍&性能优化系列

K8s相关介绍&性能优化系列
摘要:前言 SuperEdge service group 利用 application-grid-wrapper 实现拓扑感知,完成了同一个 nodeunit 内服务的闭环访问 在深入分析 application-grid-wrapper 之前,这里先简单介绍一下社区 Kubernetes 原生支持的拓 阅读全文
posted @ 2021-03-18 10:33 腾讯云原生 阅读(2732) 评论(0) 推荐(4)
摘要:引言 随着模型规模和数据量的不断增大,分布式训练已经成为了工业界主流的 AI 模型训练方式。基于 Kubernetes 的 Kubeflow 项目,能够很好地承载分布式训练的工作负载,业已成为了云原生 AI 领域的事实标准,在诸多企业内广泛落地。 尽管 Kubeflow 让基于 Kubernetes 阅读全文
posted @ 2021-03-16 11:47 腾讯云原生 阅读(1012) 评论(0) 推荐(0)
摘要:周成,腾讯云工程师,主要负责腾讯etcd监控平台设计、开发、运维工作,具备大规模Kubernetes和etcd集群运维开发经验。 唐聪,腾讯云资深工程师,极客时间专栏《etcd实战课》作者,etcd活跃贡献者, 主要负责腾讯云万级K8s集群和内部业务的公共etcd平台以及serverless产品研发 阅读全文
posted @ 2021-03-11 10:26 腾讯云原生 阅读(1169) 评论(0) 推荐(0)
摘要:作者介绍 李昂,腾讯高级开发工程师,主要关注容器存储和镜像存储相关领域,目前主要负责腾讯容器镜像服务和镜像存储加速系统的研发和设计工作。 李志宇,腾讯云后台开发工程师。负责腾讯云 TKE 集群节点和运行时相关的工作,包括 containerd、docker 等容器运行时组件的定制开发和问题排查。 洪 阅读全文
posted @ 2021-02-25 11:29 腾讯云原生 阅读(1000) 评论(0) 推荐(1)