打赏
  2024年4月9日
摘要: 前提概要:该k8s集群为测试集群 故障报错1: 排障: 查询kube-apiserver服务状态: 可以看出cni使用了docker和cri-dockerd两种,所以涉及:unix:///run/containerd/containerd.sock unix:///var/run/cri-docke 阅读全文
posted @ 2024-04-09 20:44 wadeson 阅读(2) 评论(0) 推荐(0) 编辑
  2021年10月24日
摘要: 1、环境节点准备: 角色 IPmaster 192.168.77.10 系统盘:/dev/sda 数据盘:/dev/sdbnode1 192.168.77.11 系统盘:/dev/sda 数据盘:/dev/sdbnode2 192.168.77.12 系统盘:/dev/sda 数据盘:/dev/sd 阅读全文
posted @ 2021-10-24 18:12 wadeson 阅读(689) 评论(0) 推荐(0) 编辑
  2021年2月28日
摘要: 问题:巡检发现k8s集群的etcd集群状态不对,其中有一个节点不健康,现象如下: [root@k8s-master1 ~]# kubectl get cs NAME STATUS MESSAGE ERROR controller-manager Healthy ok scheduler Health 阅读全文
posted @ 2021-02-28 22:20 wadeson 阅读(2914) 评论(0) 推荐(0) 编辑
  2020年10月11日
摘要: 节点规划: master:172.16.23.120 node1:172.16.23.121 node2:172.16.23.122 zabbix:172.16.23.131 以master节点作为nginx负载均衡进行配置如下: [root@master conf]# cat nginx.conf 阅读全文
posted @ 2020-10-11 18:09 wadeson 阅读(218) 评论(0) 推荐(0) 编辑
  2020年10月6日
摘要: 节点设置: zookeeper节点172.16.23.120,172.16.23.121,172.16.23.122 [root@master zookeeper]# cat /etc/ansible/hosts |tail -20 ## db-[99:101]-node.example.com [ 阅读全文
posted @ 2020-10-06 23:15 wadeson 阅读(336) 评论(0) 推荐(0) 编辑
  2020年9月22日
摘要: prometheus监控之自动发现,这里采用服务端添加配置文件,具体操作如下,目前prometheus server只有如下节点: 现在开始添加配置文件: 1.首先创建存放配置文件的目录: # mkdir /usr/local/prometheus/target/node/ -p 2.然后在prom 阅读全文
posted @ 2020-09-22 23:35 wadeson 阅读(6050) 评论(0) 推荐(0) 编辑
  2020年9月20日
摘要: 打开prometheus监控控制台:http://172.16.23.120:9090/graph 1.获取cpu使用率:100-(avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by(instance) *100) 其中irate函数:ira 阅读全文
posted @ 2020-09-20 23:22 wadeson 阅读(4577) 评论(0) 推荐(0) 编辑
摘要: 基础信息配置: 角色 ip port hostname prometheus server 172.16.23.120 9090 master node_exporter master 172.16.23.120 9100 master node_exporter node1 172.16.23.1 阅读全文
posted @ 2020-09-20 22:00 wadeson 阅读(6375) 评论(0) 推荐(0) 编辑
摘要: 1.prometheus服务端监控安装 # cd /usr/local/# wget https://github.com/prometheus/prometheus/releases/download/v2.21.0/prometheus-2.21.0.linux-amd64.tar.gz# ta 阅读全文
posted @ 2020-09-20 18:36 wadeson 阅读(795) 评论(0) 推荐(0) 编辑
  2018年12月29日
摘要: 前面介绍并初试了es6.5系列的单节点的操作,现在搭建es6.5系列的集群: 环境:三节点:master-172.16.23.128.node1-172.16.23.129.node2-172.16.23.130,首先查看es的服务状态: 查看各节点上面的es的配置文件: 现在基于discovery 阅读全文
posted @ 2018-12-29 17:27 wadeson 阅读(956) 评论(0) 推荐(0) 编辑