容器-promQL语法之CPU指标

 k8s通过request(下限)和limit(上限)限制容器的CPU和内存的使用范围

在容器运行的过程中需要实时监控容器对cpu的使用情况

1、 容器用户态占用CPU的时间总和

container_cpu_user_seconds_total

2、 容器内核态占用CPU的时间总和

container_cpu_system_seconds_total

 3、 container_cpu_user_seconds_total与container_cpu_system_seconds_total的总和,代表容器占用CPU的总和

container_cpu_usage_seconds_total

 4、 由于这些指标都是计数器类型的,所以可以通过rate函数获取样本变化率

获取5min的样本变化率的表达式如下:

sum (rate(container_cpu_usage_seconds_total[5m])) by (container_name)

 5、容器的每次CPU消耗超过设置的上限后,都会以累加的方式得到记录

在 container_cpu_cfs_throttled_seconds_total 指标中可以通过rate函数获取变化率

sum (rate(container_cpu_cfs_throttled_seconds_total[5m])) by (container_name)

 如果容器的这个指标过高,则需要调整CPU的上限或者查看程序是有死循环等问题

 

6、 查询容器相关的 数据:查询所有POD的1min内CPU使用情况,用到的数据指标是<container_cpu_usage_seconds_total>

由于查询到的数据都是容器相关的,所以最好按照Pod聚合,对应的promQL语句如下

sum by (pod) ( rate(container_cpu_usage_seconds_total{image!="",pod!=""}[1m]))

 

posted @ 2021-11-29 20:12  大军军军之技术落地  阅读(2036)  评论(0编辑  收藏  举报