随笔分类 -  Kubernetes

1
容器编排
摘要:在前文中,我们了解了 Flannel UDP 模式的工作原理、容器跨主机通信的路由与 TUN 设备应用,以及由用户态与内核态切换带来的性能瓶颈问题。接下来,我们将继续深入,了解 Flannel VXLAN 模式,利用与 UDP 模式类似的 IP 信息、网络配置和基本流程,展示 VXLAN 如何在内核 阅读全文
posted @ 2025-04-09 22:06 rxg456 阅读(69) 评论(0) 推荐(0)
摘要:在微服务时代,容器化部署已成为主流。在分布式部署环境中,如何实现跨主机的容器通信始终是架构设计中必须解决的重要问题。本文将从 Overlay 网络的基本概念出发,介绍 Flannel 后端实现方案,并重点解析 Flannel UDP 模式的工作原理及其性能瓶颈。 一、Overlay Network 阅读全文
posted @ 2025-04-08 22:21 rxg456 阅读(109) 评论(0) 推荐(0)
摘要:容器技术通过轻量化的资源隔离机制,极大地简化了应用部署的复杂性。而容器网络作为容器生态的核心组件,直接影响着容器间通信、服务发现及跨主机协同的能力。本文将从容器网络的基础组件出发,逐步剖析其工作原理及关键实现。 一、容器网络栈:隔离的基石 所谓网络栈,就包括了:网卡(Network Interfac 阅读全文
posted @ 2025-04-01 00:44 rxg456 阅读(155) 评论(0) 推荐(0)
摘要:一. kubernetes中如何管理GPU AI基础设施变革: 2016年TensorFlow等框架兴起催生分布式训练需求 云原生场景下GPU管理的核心挑战: 设备隔离性(避免多容器争抢) 驱动兼容性(主机驱动 vs 容器内驱动) 资源可见性(调度器感知设备状态) 以 NVIDIA 的 GPU 设备 阅读全文
posted @ 2025-03-26 22:07 rxg456 阅读(231) 评论(0) 推荐(0)
摘要:详细了解调度框架(Scheduler Framework)的调度过程。个人观点,请多多指教。 一. 调度框架的核心组件 首先了解调度阶段会经过的组件,主要包括以下组件: QueueSort 负责对调度队列中的 Pod 进行排序,影响调度器选择 Pod 的顺序。默认情况下,Kubernetes 使用基 阅读全文
posted @ 2025-03-25 18:36 rxg456 阅读(136) 评论(0) 推荐(0)
摘要:一. 新建的Pod如何调度到Node节点? Kubernetes 调度过程是将 Pod 分配到集群中合适节点的过程。具体流程如下: Pod 创建 : 用户通过 kubectl 或 API 创建 Pod API Server 处理 : API Server 对 Pod 的合法性进行校验(如资源请求格式 阅读全文
posted @ 2025-03-20 00:59 rxg456 阅读(130) 评论(0) 推荐(0)
摘要:一. KubeBlocks是什么? kubeBlocks 是一个开源的 Kubernetes 数据库 operator,能够帮助用户在 Kubernetes 上运行和管理多种类型的数据库。据我们所知,大多数数据库 operator 通常只能管理某种特定类型的数据库,例如: CloudNativePG 阅读全文
posted @ 2025-03-11 23:48 rxg456 阅读(440) 评论(0) 推荐(0)
摘要:本文阅读代码链接:https://github.com/kubernetes/client-go/tree/release-1.30 下面代码全部在 tools/cache/delta_fifo.go 文件中: 一. DeltaFIFO 的基本概念 DeltaFIFO 是 client-go 中的核 阅读全文
posted @ 2025-03-11 21:30 rxg456 阅读(94) 评论(0) 推荐(0)
摘要:一. 概述 本文采用了分层CRD的方式实现模块化操作,使高级别的CRD可以控制低级别的CRD。这种模式在云原生应用中非常有用,尤其是对于复杂的工作流程管理。 下面将实现一个模块化Operator示例,包括上层CRD和下层CRD的定义及控制器实现。 二. 设计概念 我们将创建两个CRD: Workfl 阅读全文
posted @ 2025-03-09 16:51 rxg456 阅读(136) 评论(0) 推荐(0)
摘要:一. 资源需求与硬件支持 AI大模型K8s: GPU密集型:需要大量GPU资源(如NVIDIA A100/H100),支持多卡并行(如NCCL通信)。 异构计算:可能集成TPU或其他AI加速芯片(如华为昇腾)。 高内存需求:大模型参数规模(如千亿级参数)需要大容量内存(如HBM)和高带宽。 显存优化 阅读全文
posted @ 2025-03-08 15:23 rxg456 阅读(489) 评论(0) 推荐(0)
摘要:一、核心实现逻辑 通过 ctrl.Result 的 定时重试(RequeueAfter) 和 状态标记(Status Conditions) 组合,实现对异步操作全生命周期管理。 分阶段状态管理 // 状态类型定义 type Phase string const ( PhaseCreating Ph 阅读全文
posted @ 2025-03-06 00:17 rxg456 阅读(89) 评论(0) 推荐(0)
摘要:一、周期性任务调度与动态时间校准 核心场景: 定时巡检任务 return ctrl.Result{RequeueAfter: 10 * time.Minute}, nil 应用场景: 定期检查资源健康状态(如数据库备份完成度) 定时触发清理任务(如日志归档) 最佳实践: 结合LastTransiti 阅读全文
posted @ 2025-03-04 23:56 rxg456 阅读(90) 评论(0) 推荐(0)
摘要:一. Operator 概述 Kubernetes Operator 是一种封装、部署和管理复杂有状态应用的高级方法。它通过扩展 Kubernetes API 和控制器模式,将运维领域的知识(如备份、扩缩容、故障恢复)编码到自定义逻辑中,使应用可以像管理原生 Kubernetes 资源(如 Depl 阅读全文
posted @ 2025-03-02 18:59 rxg456 阅读(553) 评论(0) 推荐(0)
摘要:Traefik插件架构使开发人员可以轻松创建新插件、修改现有插件以及与 Traefik 社区共享插件 阅读全文
posted @ 2022-05-15 00:37 rxg456 阅读(237) 评论(0) 推荐(0)
摘要:插件支持是一项强大的功能,允许开发人员向 Traefik 添加新功能并定义新行为。例如,插件可以修改请求或标头、发出重定向、添加身份验证等,提供与 Traefik中间件类似的功能 阅读全文
posted @ 2022-05-13 00:28 rxg456 阅读(137) 评论(0) 推荐(0)
摘要:附加到路由器的中间件是一种在请求发送到您的[服务](https://doc.traefik.io/traefik/routing/services/)之前(或在服务的答案发送到客户端之前)调整请求的方法。 Traefik 中有几个可用的中间件,有的可以修改请求、headers,有的负责重定向,有的添加认证等等。 使用相同协议的中间件可以组合成链以适应各种场景。 阅读全文
posted @ 2022-05-12 00:06 rxg456 阅读(157) 评论(0) 推荐(0)
摘要:附加到路由器的中间件是一种在请求发送到您的[服务](https://doc.traefik.io/traefik/routing/services/)之前(或在服务的答案发送到客户端之前)调整请求的方法。 Traefik 中有几个可用的中间件,有的可以修改请求、headers,有的负责重定向,有的添加认证等等。 使用相同协议的中间件可以组合成链以适应各种场景。 阅读全文
posted @ 2022-05-11 23:33 rxg456 阅读(813) 评论(0) 推荐(0)
摘要:附加到路由器的中间件是一种在请求发送到您的[服务](https://doc.traefik.io/traefik/routing/services/)之前(或在服务的答案发送到客户端之前)调整请求的方法。 Traefik 中有几个可用的中间件,有的可以修改请求、headers,有的负责重定向,有的添加认证等等。 使用相同协议的中间件可以组合成链以适应各种场景。 阅读全文
posted @ 2022-05-09 01:24 rxg456 阅读(481) 评论(0) 推荐(0)
摘要:Traefik是一个开源的Edge Router,它使发布你的服务成为一种有趣和简单的体验。它代表你的系统接收请求,并找出负责处理这些请求的组件。 除了它的许多功能外,Traefik的与众不同之处在于它能自动为你的服务发现正确的配置。当Traefik检查你的基础设施时,神奇的事情发生了,它发现了相关信息,并发现哪个服务为哪个请求服务。 Traefik原生兼容每一种主要的集群技术,如Kubernetes、Docker、Docker Swarm、AWS、Mesos、Marathon等;并且可以同时处理许多集群。(它甚至适用于在裸机上运行的传统软件)。 有了Traefik,就不需要维护和同步一个单独的配置文件:一切都会自动、实时地发生(没有重新启动,没有连接中断)。有了Traefik,你可以把时间花在开发和部署新功能上,而不是配置和维护其工作状态上。 阅读全文
posted @ 2022-05-06 19:17 rxg456 阅读(131) 评论(0) 推荐(0)
摘要:Træfɪk 是一个为了让部署微服务更加便捷而诞生的现代HTTP反向代理、负载均衡工具... 阅读全文
posted @ 2021-04-01 15:42 rxg456 阅读(754) 评论(0) 推荐(0)

1