随笔分类 - K8S云原生
摘要:情况描述:部署了ingress-nginx,同时设置service clusterIP: None。 问题:这种情况下,是否还需要使用kub-proxy? 根据描述的情况,即部署了ingress-nginx并设置了Service的clusterIP: None(通常称为Headless Servic
阅读全文
摘要:在 Kubernetes 中要实现容器之间网络的隔离,是通过一个专门的 API 对象 NetworkPolicy(网络策略)来实现的,要让网络策略生效,就需要特定的网络插件支持,目前已经实现了 NetworkPolicy 的网络插件包括 Calico、Weave 和 kube-router 等项目,
阅读全文
摘要:Containerd已成Kubernetes“新宠” Docker 曾经是最早广泛使用的容器运行时,这也使用户对 Docker 非常熟悉。Kubernetes 最初支持 Docker 是通过在项目中内置了一个组件称为 "dockershim" 来实现的。随着容器生态系统的发展,Kubernetes
阅读全文
摘要:环境 1.软件版本 系统版本 centos 7.9(内核采用4.19) docker 20.10.15 kubeadm 1.22.17 2.ip划分 主机名ip地址系统配置 kubeadm-master 10.103.236.201 2core_2g kubeadm-node01 10.103.23
阅读全文
摘要:1. 背景 绝大数事故发生在应用上下线发布阶段,所以要尽可能避免发布过程中由于应用自身代码问题对用户造成的影响。 业界发布规范: 可灰度(可以通过 Argo Rollout/OpenKruise 支持) 可观测(容器状态、容器速查大盘、发布/配置变更/K8s 事件、业务日志/业务埋点、jstack/
阅读全文
摘要:1. 什么是 HPA ? HPA(Horizontal Pod Autoscaler)是 Kubernetes 中的一种资源自动伸缩机制,用于根据某些指标动态调整 Pod 的副本数量。 2. 什么时候需要 HPA ? 负载波动:当您的应用程序的负载经常发生波动时,HPA 可以自动调整 Pod 的副本
阅读全文
摘要:1. 上价值 从虚拟机到 Kubernetes 转变的收益 更高效的利用系统资源:虚拟化本身大概占用10%的宿主机资源消耗,在集群规模足够大的时候,这是一块非常大的资源浪费。 保证环境的一致性:环境不一致问题是容器镜像出现之前业界的通用问题,不利于业务的快速上线和稳定性。 加快资源交付和扩缩容:虚拟
阅读全文
摘要:1. 影响范围和故障时间线 影响范围 ... 影响时间线(2022-xx-xx xx:xx ~ 2022-xx-xx xx:xx) ... 2. 故障发生原因 故障现象 根因分析 ... 3. Why 分析 5 why 分析法 4. 后续 TODO
阅读全文
摘要:问题:镜像仓库认证 secret 创建后,被 rancher 更新为 旧密码 解决方式:删除 项目id 相对应的namespace 下的 secret,停止自动同步更新 原因:之前 创建 镜像仓库凭证 是通过 rancher UI 创建,作用域为 项目下所有命令空间 排查思路: 查看 secrets
阅读全文
摘要:Kubernetes中namespace有两种常见的状态,即Active和Terminating状态,其中Terminating状态一般会比较少见,当对应的命名空间下还存在运行的资源,但该命名空间被删除时才会出现所谓的Terminating状态,这种情况下只要等待Kubernetes本身将命名空间下
阅读全文
摘要:Pod 驱逐场景总结 从一个 SRE 角度看, Pod 驱逐分为两种情况: 较安全驱逐 & 提高稳定性的良性驱逐 API 发起驱逐,典型案例:kubectl drain Node Not Ready 时,Controller Manager 发起的驱逐 有风险的驱逐 节点压力驱逐 节点磁盘空间不足、
阅读全文
摘要:Etcd 磁盘空间爆满解决方案 etcd默认的空间配额限制为2G,超出空间配额限制就会影响服务,所以需要定期清理 设置环境变量 ETCD_CA_CERT="/etc/kubernetes/pki/etcd/ca.crt" ETCD_CERT="/etc/kubernetes/pki/etcd/ser
阅读全文
摘要:目的 本次演练旨在测试 Kubernetes 的 etcd 高可用性,检验是否能够在其中一个 etcd 节点发生故障的情况下,其他 etcd 节点能够接管其工作,确保集群仍能正常运行。 集群架构 演练场景 在一个三节点的 Kubernetes 集群中,我们将模拟其中一个 etcd 节点的故障,观察剩
阅读全文
摘要:一、背景 应安全规范,对 apiserver 核心组件,需要记录,"谁在什么时候操作了什么" 方便故障排查 二、操作步骤 apiserver 开启审计日志 在所有 master 节点执行 备份 配置文件 mkdir -p /home/clay/bak$(date +%F) cp /etc/kuber
阅读全文
摘要:出故障时,就知道是谁在裸泳 🙃 K8s 投产使用,备份是保命手段,必须要上,建议做一个 checklist,巡检通过,集群才能对外提供服务 备份方案制定 物理备份:etcd 备份,保存某一个时刻的快照,快捷方便。 逻辑备份:velero 备份 ,允许用户自己选择备份的内容,比如单个 namespa
阅读全文
摘要:上线前,基准测试的重要性,这篇文章着重介绍一下「Linux 性能基准测试工具及测试方法」 还是老规矩,先请性能领域的大师布伦丹·格雷格(Brendan Gregg)登场 👏👏👏 整理测试指标如下图 测试环境说明: CentOS7, 4c8g CPU Super_Pi 是一种用于计算圆周率π的程
阅读全文
摘要:背景 Kubernetes是容器集群管理系统,为容器化的应用提供资源调度、部署运行、滚动升级、扩容缩容等功能。容器集群管理给业务带来了便利,但是随着业务的不断增长,应用数量可能会发生爆发式的增长。那在这种情况下,Kubernetes能否快速地完成扩容、扩容到大规模时Kubernetes管理能力是否稳
阅读全文
摘要:背景 k8s 目前使用的内核 版本为:4.9.220,存在以下bug: CPU 限流open in new window https://github.com/fho/docker-samba-loop moby/moby#5618open in new window coreos/bugs#254
阅读全文
摘要:背景 如果某些pod 没有设置资源限制,导致 node 节点 负载过高,进而导入 kubelet 和 apiserver 的心跳出现问题,节点就会 Not Ready Not Ready 的 节点 开始驱逐应用,当没有资源限制的应用跑到其他 节点,其他节点也会产生连锁反应,load 高,心跳失败,N
阅读全文
摘要:概述 什么是 DNS ? 域名系统(英语:Domain Name System,缩写:DNS)是互联网的一项服务。它作为将域名和IP地址相互映射的一个分布式数据库,能够使人更方便地访问互联网。DNS使用TCP和UDP端口53。 DNS 不仅方便了人们访问不同的互联网服务,更为很多应用提供了,动态服务
阅读全文

浙公网安备 33010602011771号