12 2019 档案

摘要:一、基于kubernetes的cAdvisor监控容器 1、修改prometheus数据抓取配置文件 - job_name: 'kubernetes-cadvisor' kubernetes_sd_configs: - role: node scheme: https tls_config: ca_ 阅读全文
posted @ 2019-12-31 15:37 jayce9102 阅读(741) 评论(0) 推荐(0)
摘要:一、实验方式 使用sidecar模式运行reids+redis-exporter prometheus中添加redis的抓取任务 web页面查看 二、创建reids及redis-exporter cat prome-redis.yaml apiVersion: apps/v1 kind: Deplo 阅读全文
posted @ 2019-12-30 11:33 jayce9102 阅读(758) 评论(0) 推荐(0)
摘要:一、添加配置文件 cat prometheus-additional.yaml - job_name: 'kubernetes-service-endpoints' kubernetes_sd_configs: - role: endpoints relabel_configs: - source_ 阅读全文
posted @ 2019-12-28 16:52 jayce9102 阅读(599) 评论(0) 推荐(0)
摘要:一、简介 Saltstack使用Python开发,是一个非常简单易用和轻量级的管理工具。由Master和Minion构成,通过ZeroMQ进行通信 Saltstack的master端监听4505与4506端口,4505为salt的消息发布系统,4506为salt客户端与服务端通信的端口 salt客户 阅读全文
posted @ 2019-12-23 20:19 jayce9102 阅读(580) 评论(0) 推荐(0)
摘要:一、背景 集群是二进制部署 部署完成后一起正常,各种资源对象均可正常创建、 部署应用后发现无法跨节点通信,且pod的ip都是172.17.0.0段的 二、排查过程层 查看节点路由,发现docker0网卡居然是172.17.0.0段(what?) 查找如下资料:基于docker的CNM部署flanel 阅读全文
posted @ 2019-12-20 22:33 jayce9102 阅读(1047) 评论(0) 推荐(0)
摘要:一、Prometheus支持的多种服务发现机制(常用如下) static_configs: 静态服务发现 file_sd_configs: 文件服务发现 dns_sd_configs: DNS 服务发现 kubernetes_sd_configs: Kubernetes 服务发现 consul_sd 阅读全文
posted @ 2019-12-20 17:43 jayce9102 阅读(2970) 评论(0) 推荐(0)
摘要:一、步骤及注意事项(前提,部署参考部署篇) 一般etcd集群会开启HTTPS认证,因此访问etcd需要对应的证书 使用证书创建etcd的secret 将etcd的secret挂在到prometheus 创建etcd的servicemonitor对象(匹配kube-system空间下具有k8s-app 阅读全文
posted @ 2019-12-20 15:56 jayce9102 阅读(3497) 评论(0) 推荐(0)
摘要:一、生产环境中部分服务的使用场景有前置条件 使用initContainers,做一些前置服务的检测动作,以确定前置服务已正常运行且能对外提供服务(若检测未通过则本pod无法启动) 使用livenessProbe,进行前置服务的检查或端口探测(优点,若不存在则会反复重启直至前置服务正常) 对比使用:l 阅读全文
posted @ 2019-12-19 17:18 jayce9102 阅读(161) 评论(0) 推荐(0)
摘要:一、背景 公司进行kubernetes服务重启演练,集群重启后所有服务正常,仅node2节点处于notready状态 二、排查过程 查看对应节点的详细信息,发现kubelet一直处于starting状态 登录对应节点,查看kubelet的ERROR日志 进行各种资料查看无果 逐条读解日志,发现日志中 阅读全文
posted @ 2019-12-18 20:12 jayce9102 阅读(394) 评论(0) 推荐(0)
摘要:一、从git拉取相应yaml文件 git clone https://github.com/coreos/kube-prometheus.git 二、修改grafana及prometheus的service(nodeport模式) grafana-service.yaml和prometheus-se 阅读全文
posted @ 2019-12-17 19:57 jayce9102 阅读(1850) 评论(0) 推荐(0)
摘要:一、访问控制概述 API server作为访问kubernetes集群的网关,也是唯一入口 所有客户端访问集群都必须进行合法性检验:1)用户身份鉴别2)操作权限验证3)是否符合全局约束4)所有验证均通过才能访问或存入数据到etcd中 客户端认证操作:由 API Server 配置的一到多个认证插件完 阅读全文
posted @ 2019-12-17 14:05 jayce9102 阅读(437) 评论(0) 推荐(0)
摘要:一、下载tar包并解压 yum -y install wget glibc.i686 #后面一个是依赖包,不安装会报错: /lib/ld-linux.so.2: bad ELF interpreterwget https://dl.google.com/go/go1.13.5.linux-386.t 阅读全文
posted @ 2019-12-16 16:40 jayce9102 阅读(341) 评论(0) 推荐(0)
摘要:一、服务分类 在线服务:请求的客户端和发起者需要立即响应(高并发、低延迟:并发数、接口响应时间、错误数、延迟时间),面对突发流量能进行资源的自动伸缩 离线服务:请求发送到服务端但不要求立即获取结果(监控服务的每个执行阶段、成功/失败的次数) 批处理:批量任务的执行(一般定时执行),针对每个任务的执行 阅读全文
posted @ 2019-12-16 16:21 jayce9102 阅读(5567) 评论(0) 推荐(0)