随笔分类 -  K8s与AI

上一页 1 ··· 3 4 5 6 7 8 下一页
摘要:在Kubernetes中,创建Pod的流程涉及多个核心组件(API Server、etcd、kube-scheduler、kubelet、容器运行时等)的协同工作,遵循“声明式API”的原则(用户声明目标状态,K8s通过组件协作将实际状态推向目标状态)。完整流程可分为以下6个关键步骤: 1. 用户提 阅读全文
posted @ 2025-08-11 10:22 天道酬勤zjh 阅读(14) 评论(0) 推荐(0)
摘要:在Kubernetes中,Pod的生命周期是从创建到终止的完整过程,包含多个阶段(Phase) 和状态(Condition),其流转受到容器状态、健康检查、重启策略等因素影响。核心生命周期阶段及关键节点如下: 一、Pod的核心阶段(Phase) Pod的status.phase字段定义了其生命周期的 阅读全文
posted @ 2025-08-11 10:20 天道酬勤zjh 阅读(16) 评论(0) 推荐(0)
摘要:在Kubernetes中,Pod的调度策略由kube-scheduler(默认调度器)或自定义调度器决定,其核心目标是将Pod合理分配到集群节点上。影响调度策略的因素可分为调度约束、资源因素、节点特性、策略配置等几大类,具体如下: 1. 标签与选择器(基础匹配规则) 标签(Label)是K8s中用于 阅读全文
posted @ 2025-08-11 10:15 天道酬勤zjh 阅读(24) 评论(0) 推荐(0)
摘要:在Kubernetes中,集群外部节点(如本地机器、其他服务器等)访问Pod需要通过K8s提供的“桥梁”实现(因为Pod IP是集群内部私有IP,外部无法直接访问)。常见的访问方式如下,适用于不同场景: 1. 通过 NodePort 类型的 Service 原理:创建一个 NodePort 类型的S 阅读全文
posted @ 2025-08-11 10:04 天道酬勤zjh 阅读(60) 评论(0) 推荐(0)
摘要:在K8s集群外部突然无法访问Pod时,排查需遵循“从底层到上层、从目标到入口”的逻辑,结合具体访问路径(如Service、Ingress)逐步定位问题,核心思路如下: 1. 先明确访问路径(关键前提) 外部访问Pod的方式决定了排查方向,需先确认是通过哪种方式访问: 直接通过 Service:如 N 阅读全文
posted @ 2025-08-11 10:02 天道酬勤zjh 阅读(27) 评论(0) 推荐(0)
摘要:在 Kubernetes 集群外部突然无法访问 Pod 时,需从“外部访问路径”入手,按“从外向内、逐层穿透”的思路排查,重点关注访问入口(如 Service、Ingress)、网络链路、Pod 状态及配置等环节。以下是具体排查步骤: 一、明确外部访问的路径(关键前提) 首先需确认外部访问 Pod 阅读全文
posted @ 2025-08-08 09:56 天道酬勤zjh 阅读(77) 评论(0) 推荐(0)
摘要:在 Kubernetes 中,Service 用于为一组 Pod 提供固定的网络访问点,并实现 Pod 之间的负载均衡和服务发现。根据暴露服务的范围和方式,Service 主要分为以下 4 种类型,另有 1 种特殊的“无头服务(Headless Service)”用于特定场景: 1. Cluster 阅读全文
posted @ 2025-08-08 09:54 天道酬勤zjh 阅读(77) 评论(0) 推荐(0)
摘要:在 Kubernetes 中,镜像拉取策略(imagePullPolicy)用于定义 kubelet 如何拉取容器镜像,决定了在创建 Pod 时是否以及何时从镜像仓库拉取镜像。主要有以下三种策略: 1. Always 行为:每次创建或重启容器时,强制从镜像仓库拉取镜像,无论本地节点是否已存在该镜像。 阅读全文
posted @ 2025-08-08 09:53 天道酬勤zjh 阅读(102) 评论(0) 推荐(0)
摘要:在 Kubernetes 中,“扩容和缩容”通常涉及两个层面:Pod 层面(调整应用副本数)和节点层面(调整集群节点数量)。两者的操作方式和目标不同,以下分别说明: 一、Pod 层面的扩缩容(调整应用副本数) 通过 Kubernetes 控制器(如 Deployment、StatefulSet、Re 阅读全文
posted @ 2025-08-08 09:52 天道酬勤zjh 阅读(203) 评论(0) 推荐(0)
摘要:在 Kubernetes 中,集群日志收集涉及多个层面(容器、节点、控制平面组件等),且 Kubernetes 本身未提供内置的日志聚合解决方案,需结合第三方工具实现。以下是常用的日志收集方案、核心工具及实施思路: 一、日志收集的核心对象 需收集的日志主要包括三类: 容器日志:容器内应用输出到 st 阅读全文
posted @ 2025-08-08 09:50 天道酬勤zjh 阅读(9) 评论(0) 推荐(0)
摘要:在 Kubernetes 中,集群日志收集涉及多个层面(容器、节点、控制平面组件等),且 Kubernetes 本身未提供内置的日志聚合解决方案,需结合第三方工具实现。以下是常用的日志收集方案、核心工具及实施思路: 一、日志收集的核心对象 需收集的日志主要包括三类: 容器日志:容器内应用输出到 st 阅读全文
posted @ 2025-08-08 09:46 天道酬勤zjh 阅读(52) 评论(0) 推荐(0)
摘要:在 Kubernetes 中,Pod 的状态(Phase)和详细状态(Condition/Reason)反映了其生命周期的不同阶段和健康状况。理解这些状态对于排查 Pod 问题至关重要。 一、Pod 主要状态(Phase) Kubernetes 定义了 5 种顶层状态(Phase),描述 Pod 从 阅读全文
posted @ 2025-08-08 09:44 天道酬勤zjh 阅读(66) 评论(0) 推荐(0)
摘要:Flannel 是 Kubernetes 中常用的 CNI 插件,主要用于实现跨节点 Pod 之间的网络连通性。它通过为集群中的每个节点分配独立的 Pod 子网,并基于不同的“后端模式”实现子网间的数据包转发,核心目标是解决容器网络的“跨节点通信”问题。 一、Flannel 的主要工作模式(后端类型 阅读全文
posted @ 2025-08-08 09:43 天道酬勤zjh 阅读(50) 评论(0) 推荐(0)
摘要:Flannel 和 Calico 是 Kubernetes 中最常用的两种 CNI(容器网络接口)插件,均用于实现 Pod 之间的网络连通性,但在设计理念、功能特性、性能和适用场景上有显著区别。以下从核心维度对比两者的差异: 1. 网络模型与通信方式 这是两者最根本的区别,直接影响网络性能和部署复杂 阅读全文
posted @ 2025-08-08 09:42 天道酬勤zjh 阅读(145) 评论(0) 推荐(0)
摘要:在Kubernetes中,通过NodePort暴露的服务无法访问时,可按照以下步骤逐步排查,从服务配置到网络链路逐层定位问题: 1. 检查Service本身配置与状态 首先确认Service是否正确创建且NodePort已正常分配。 查看Service基本信息 执行命令: kubectl get s 阅读全文
posted @ 2025-08-08 09:40 天道酬勤zjh 阅读(94) 评论(0) 推荐(0)
摘要:在 Kubernetes 集群中,Node 数量增多(即集群规模扩大)会从 性能、复杂度、可用性、资源管理 等多个维度产生影响,既有积极作用,也可能带来挑战。具体影响如下: 一、积极影响 资源池扩大,承载能力提升 节点数量增加意味着集群的总 CPU、内存、存储等资源总量提升,可部署更多 Pod 和应 阅读全文
posted @ 2025-08-07 09:33 天道酬勤zjh 阅读(11) 评论(0) 推荐(0)
摘要:Kubernetes(K8s)和Docker Swarm 都是主流的容器编排工具,但两者在设计目标、功能特性和适用场景上有显著差异。以下从 K8s 相对 Docker Swarm 的优势 和 劣势 两方面进行对比分析: 一、K8s 相比 Docker Swarm 的优势 功能更全面,适应复杂场景 精 阅读全文
posted @ 2025-08-07 09:31 天道酬勤zjh 阅读(53) 评论(0) 推荐(0)
摘要:在 Kubernetes 中,Pod 多副本配置了硬亲和性(nodeAffinity 的 requiredDuringSchedulingIgnoredDuringExecution) 时,是否会被调度到同一个节点,取决于硬亲和性规则的具体配置——硬亲和性仅规定 Pod“可以调度到哪些节点”,但不直 阅读全文
posted @ 2025-08-07 09:29 天道酬勤zjh 阅读(18) 评论(0) 推荐(0)
摘要:当 Pod 中的容器因内存溢出(OOM,Out Of Memory)被杀死时,容器状态会显示 OOMKilled,Pod 可能反复重启(取决于 restartPolicy)。排查 OOM 问题需从 资源配置、应用行为、节点状态 三个维度入手,定位内存溢出的根本原因。 一、确认 OOM 状态与基本信息 阅读全文
posted @ 2025-08-07 09:24 天道酬勤zjh 阅读(113) 评论(0) 推荐(0)
摘要:在 Kubernetes 中,“迁移”通常指将应用、数据或整个集群从一个环境(如旧集群、其他云厂商、物理机)迁移到新的 Kubernetes 集群。迁移的复杂度取决于场景(如无状态应用 vs 有状态应用、跨版本迁移、跨云迁移等),但核心思路是确保迁移过程中业务中断最小、数据一致、配置兼容。 一、迁移 阅读全文
posted @ 2025-08-07 09:22 天道酬勤zjh 阅读(150) 评论(0) 推荐(0)

上一页 1 ··· 3 4 5 6 7 8 下一页