上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 90 下一页
摘要: 介绍 Prometheus 支持 4 种 指标类型,分别是 Counter、Gauge、Histogram 和 Summary。 Counter 指标类型,指标值是只能递增,不能递减的数值。需要注意的是,当 Prometheus server 重启时,指标值会被重置为 0。该指标类型可用于统计接口的 阅读全文
posted @ 2023-11-26 13:04 牛奔 阅读(472) 评论(0) 推荐(0)
摘要: 前言 使用 json.dumps(result) 对数据转 JSON 数据出现错误:TypeError: Object of type float32 is not JSON serializable 数据中存在的 float32 数据是 numpy 格式的数据,Python 内置的 float 类 阅读全文
posted @ 2023-11-13 22:50 牛奔 阅读(807) 评论(0) 推荐(0)
摘要: 前言 在 kubernetes 中配置 https://github.com/NVIDIA/k8s-device-plugin 时, 报错:Detected non-NVML platform: could not load NVML: libnvidia-ml.so.1: cannot open 阅读全文
posted @ 2023-10-18 21:34 牛奔 阅读(469) 评论(0) 推荐(1)
摘要: 前言 在管理 Kubernetes 集群的过程中,我们经常会遇到这样一种情况:在某台节点上发现某个进程资源占用量很高,却又不知道是哪个容器里的进程。有没有办法可以根据进程 PID 快速找到 Pod 名称呢? 解决 假设现在有一个 prometheus 进程的 PID 是 14338: 要获取容器的 阅读全文
posted @ 2023-10-12 22:35 牛奔 阅读(463) 评论(0) 推荐(0)
摘要: 前言 在 ssh -i 指定密钥文件 登录时,出现以下报错: Permissions 0644 for 'xxxx' are too open. It is required that your private key files are NOT accessible by others. This 阅读全文
posted @ 2023-10-09 20:11 牛奔 阅读(1715) 评论(0) 推荐(0)
摘要: 前言 编辑或者修改后的 dashboard 保存为 json 文件,在其他环境导入使用,报错 Failed to upgrade legacy queries Datasource xxxxxxx was not found,无法显示监控数据 问题原因为:从其他 grafana 导出的 dashbo 阅读全文
posted @ 2023-10-09 20:07 牛奔 阅读(1445) 评论(0) 推荐(0)
摘要: 报错 当我在打包 docker镜像时,发生了报错 $ sudo docker build -t dcgm-exporter:3.2.5 . 1.772 The following signatures couldn't be verified because the public key is no 阅读全文
posted @ 2023-10-04 09:52 牛奔 阅读(1091) 评论(0) 推荐(0)
摘要: 在 DCGM(Data Center GPU Manager)中,"Collect Switch Metrics" 和 "Collect Link Metrics" 是两个功能选项,用于收集关于 GPU 交换机和连接的指标数据。它们的含义如下: Collect Switch Metrics(收集交换 阅读全文
posted @ 2023-09-27 20:52 牛奔 阅读(193) 评论(0) 推荐(0)
摘要: 前言 使用 gorm 查询时,报错:stdErr = sql: Scan error on column index 0, name "total": converting NULL to float64 is unsupported 代码如下 var total float64 res := db 阅读全文
posted @ 2023-09-13 23:09 牛奔 阅读(465) 评论(0) 推荐(0)
摘要: # 前言 搭建的 harbor 仓库为 http 协议,在本地登录后,推送镜像发生如下报错: ``` docker push 192.168.xx.xx/test/grafana:v10.1.1 The push refers to repository [192.168.xx.xx/test/gr 阅读全文
posted @ 2023-09-04 21:43 牛奔 阅读(349) 评论(1) 推荐(1)
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 90 下一页