摘要: 存储服务器大流量写入由于 Ring Buffer 设置不合理导致丢包、断流的处理 现象:业务使用某厂商的私有云对象存储方案来存储大量的数据,此前已有合作的成功经验,这是另外一批存储服务器组成新的对象存储集群供业务使用,像往常一样业务并发写入大量的数据时,出现了丢包、断流的情况,严重影响业务的正常运行 阅读全文
posted @ 2026-01-26 12:38 何达维 阅读(12) 评论(0) 推荐(0)
摘要: gitlab-ce 的简单使用 简单认识 gitlab-ce 以下理解是个人理解,细节的正确性请做测试验证 😃。 请求流程: # HTTP/HTTPS 请求 客户端 (浏览器/终端) | | HTTP/HTTPS 请求 (如克隆仓库、访问网页) v 外部 Nginx 反向代理 | | 转发动态请求 阅读全文
posted @ 2026-01-19 17:43 何达维 阅读(25) 评论(0) 推荐(0)
摘要: 使用企业微信的消息推送来发送告警 实现 Prometheus 的 Alertmanager 与企业微信集成,让 Prometheus 触发的告警能够自动推送到企业微信的群聊/机器人中。 先创建企业微信机器人,复制机器人的 Webhook URL(格式类似:https://qyapi.weixin.q 阅读全文
posted @ 2026-01-17 15:44 何达维 阅读(98) 评论(0) 推荐(0)
摘要: ansible 中使用 ansible.posix.synchronize 模块来做文件同步 rsync 的一些参数 -av 很顺手,是最常用的参数了,归档模式,相当于 -rlptgoD。 默认情况下,rsync 仅同步源路径最末级的文件或目录名,-R,--relative 是 rsync 中用于保 阅读全文
posted @ 2026-01-15 18:13 何达维 阅读(11) 评论(0) 推荐(0)
摘要: kubectl top nodes 或 kubectl top pods 返回 metrics not available yet 的排查、解决 Metrics Server 是 Kubernetes 集群中用于收集和聚合节点、Pod 的资源使用指标(Metrics) 的核心组件,主要提供 CPU、 阅读全文
posted @ 2026-01-15 11:55 何达维 阅读(32) 评论(0) 推荐(0)