11 2019 档案
摘要:第一块网卡配置 第二块网卡配置 bond 配置文件 bond模式: Mode=0(balance rr)表示负载分担round robin Mode=1(active backup)表示主备模式,只有一块网卡是active,另外一块是备的standby Mode=2(balance xor)表示XO
阅读全文
摘要:[TOC] 前言 Alertmanager 用于发送告警, 是真正发送信息给用户的模块。 Alertmanager 会接受Prometheus发送过来的警告信息,再由Alertmanager来发送。 Grouping—分组 Inhibition—抑制 Silences—沉默 Client behav
阅读全文
摘要:[TOC] 说明 基于上一篇 "文章" 的基础,这里做一些关于 CPU、内存、磁盘的一些基础查询语句。 CPU 通过查询 metric值为 来获取当前CPU 的所有信息 直接通过此参数参数,会查到的数据是当前CPU的所有相关的收集到的数据。 此时就需要使用 函数,用于计算距离向量中的实际序列的每秒顺
阅读全文
摘要:[TOC] 时序 4 种类型 Prometheus 时序数据分为 "Counter" , "Gauge" , "Histogram" , "Summary" 四种类型。 Counter 表示收集的数据是按照某个趋势(增加/减少)一直变化的,我们往往用它记录服务请求总量、错误总数等。 例如 中 , 表
阅读全文
摘要:[TOC] 简介 在实际的配置中,经常会遇到增加或者减少监控主机的状况,如果每次都需要修改 配置文件,实在是太麻烦了。 此时就需要配置自动发现,而 只是很多种的自动发现 支持: 基于公有云 基于私有云 基于文件,file的自动发现 基于DNS 的自动发现,分为SRV解析自动发现和A记录解析的自动发现
阅读全文
摘要:[TOC] 前言 在 监控体系中。标签 是一个极为重要的参数,考虑到要明智的使用标签,需要使用标准的标签对整个集群进行管理控制,特别是在复杂的环境中。 一些常见的标签操作案例: 重命名标签名 删除标签 过滤目标 特别注意的是,上列操作,只有两个阶段我们可以对标签进行操作: 1. 第一阶段是重新标记来
阅读全文
摘要:[TOC] 前言 官方地址:https://github.com/google/cadvisor CAdvisor 是谷歌开发的用于分析运行中容器的资源占用和性能指标的开源工具。 CAdvisor 是一个运行时的守护进程,负责收集、聚合、处理和输出运行中容器的信息。 基于 "Prometheus 安
阅读全文
摘要:[TOC] 安装部署 环境准备 主机名 | 角色 | IP | 系统版本 | 内核版本 | | | | | es01.k8s.com | node01 | 10.0.20.11 | CentOS 7.5 | 5.1.4 1.el7.elrepo.x86_64 官网: prometheus.io 官网
阅读全文
摘要:[TOC] 简介 prometheus存储的是 ,即按相同时序( ),以时间维度存储连续的数据的集合。 时序( )是由名字( )以及一组 标签定义的,具有相同的名字以及标签属于相同时序。 Metric类型: : 一种累加的 ,如请求的个数,结束的任务数,出现的错误数等 : 常规的 ,如温度,可任意加
阅读全文
摘要:正在陆续更新,内容大体包括: rule、标签重置、cAdversior、自动发现(File 自动发现、DNS自动发现、k8s环境自动发现)等。。。 目录: prometheus【第一篇】 "Prometheus 安装" prometheus【第二篇】 "node_export 安装" prometh
阅读全文
摘要:[TOC] StatefulSet 部署 zookeeper 集群 参考 k8s官网zookeeper集群的部署,数据挂着方式改成通过本地方式创建的pv; https://kubernetes.io/docs/tutorials/stateful application/zookeeper/ 本次共
阅读全文
摘要:[TOC] 介绍 Redis代表 是一种开源的内存中数据存储,通常用作数据库,缓存或消息代理。它可以存储和操作高级数据类型,例如列表,地图,集合和排序集合。 由于 接受多种格式的密钥,因此可以在服务器上执行操作,从而减少了客户端的工作量。 它仅将磁盘用于持久性,而将数据库完全保存在内存中。 是一种流
阅读全文
摘要:解决:
阅读全文
摘要:问题描述: 在使用 工具初始化k8s后,并且安装了 flanneld 网络组建后,/var/log/messages 依旧报错, Unable to update cni config: no valid networks found in /etc/cni/net.d 问题原因是 : 似乎在v1.
阅读全文
摘要:使用kubectl logs,发现报了tls的错误,然后查看kubelet的日志,发现报了上面的错误,然后通过命令kubectl get csr查看发现有很多处于pending状态 最后通过命令 kubectl certificate approve
阅读全文
摘要:前言 Etcd 是 CoreOS 基于 Raft 开发的分布式 key-value 存储,可用于服务发现、共享配置以及一致性保障(如数据库选主、分布式锁等) 本次环境,是用于k8s集群,由于在二进制部署 k8s 中,由于 Etcd 集群导致各种各样的问题,特意抽出时间来研究 Etcd 集群。 Etc
阅读全文
摘要:[TOC] 安装 废话不多述,上来就安装 配置 修改配置如下 创建 解析文件,并写入配置 服务管理 测试解析
阅读全文
摘要:[TOC] 安装 废话不多说,直接安装 配置 修改配置: 修改后保存退出 然后编辑 文件 在文件的最后加入下面内容: 然后创建 文件,吸入内容 下面一步很重要,把刚刚创建的 文件授权 如果不做下面这一步,bind启动后没有权限读取此文件,则不会解析 服务管理 具体调试如下 测试
阅读全文

浙公网安备 33010602011771号