文章分类 -  kubernetes生产问题

kube apiserver开启kubelet服务端证书校验
摘要:apiserver参数--kubelet-certificate-authority作用 官方说明: 参数作用: 文档链接:https://kubernetes.io/zh-cn/docs/concepts/architecture/control-plane-node-communication/ 阅读全文
posted @ 2024-03-19 17:40 shelterCJJ 阅读(232) 评论(0) 推荐(0)
init container不断重启
摘要:背景 用户应用的pod正常,应用容器正常,均未发生重启,但init container一直重启 根因 查看kubelet, docker日志,/var/log/messages,以及dmesg均未发现明显的与init container重启相关内容, 使用docker ps -a命令持续观察其中一个 阅读全文
posted @ 2022-10-19 10:06 shelterCJJ 阅读(60) 评论(0) 推荐(0)
metrics-server无法正常运行(tls认证失败)
摘要:背景: k8s v1.23集群部署metrics-server后发现一直处于0/1 running状态,查看日志发现如下报错 E0902 09:18:17.917559 1 scraper.go:140] "Failed to scrape node" err="Get \"https://30.x 阅读全文
posted @ 2022-09-05 22:50 shelterCJJ 阅读(1089) 评论(0) 推荐(0)
traefik配置缺失导致域名解析404问题
摘要:背景: 工作中发现k8s集群中命名空间B-test中的某服务的域名返回404,该请求链路为: client ——> traefik(namespace:A-test) ——> ingress(namespace:B-test) ——> pod(namespace:B-test) 使用的traefik 阅读全文
posted @ 2022-08-14 18:07 shelterCJJ 阅读(313) 评论(0) 推荐(0)
kubeadm容器化集群etcd集群新增节点
摘要:背景:kubeadm部署的集群为增强etcd可用性,不改变架构的情况下新增etcd节点 环境:当前环境k8s架构,3 master+etcd, n worker | ip | name | role | | | | | | 10.0.0.6 | master01 | master+etcd | | 阅读全文
posted @ 2022-07-26 23:01 shelterCJJ 阅读(379) 评论(0) 推荐(1)
二进制集群pod无法与serviceIP通信(证书更新+iptables版本降级)
摘要:环境 版本: CentOS : 7.6.1810 (core) K8s : v1.9.1 kernel : 3.10.0-1062.9.1.el7.x86_64 iptables : iptables-1.4.21-28.el7.x86_64 现象 在问题节点上的pod内无法通过serviceIP访 阅读全文
posted @ 2022-07-14 16:00 shelterCJJ 阅读(66) 评论(0) 推荐(0)