摘要: 随着 Kubernetes 集群规模的增长(比如节点数从几十到上千、Pod 数从几百到数万甚至更多),​​监控、日志与运维体系​​ 承担着“保障集群稳定、快速定位问题、支持高效运维”的关键作用。然而,这些系统在大规模场景下极易成为新的​​性能瓶颈、复杂度来源和运维负担​​。 一、监控、日志与运维瓶颈 阅读全文
posted @ 2025-08-12 23:11 PlusBei 阅读(19) 评论(0) 推荐(0)
摘要: 1. 监控系统压力 Prometheus 等监控工具在大规模集群下可能面临: 抓取目标多、指标量大,存储与查询性能下降 配置复杂、资源占用高 建议: 使用 ​​Thanos、Cortex、VictoriaMetrics​​ 等方案做监控数据的分片与长期存储。 合理设置抓取间隔与指标粒度,避免采集过多 阅读全文
posted @ 2025-08-12 20:13 PlusBei 阅读(6) 评论(0) 推荐(0)
摘要: 1 nlogn 1.1 快速排序(Quick Sort) 快速排序通常采用分治法,选择一个基准元素(pivot),将数组分为两部分,一部分小于基准,另一部分大于基准,然后递归地对这两部分排序。关键点包括:分区操作、递归调用、原地排序(通常)等。 快速排序的核心在于分治策略和原地分区,但具体实现方式可 阅读全文
posted @ 2025-08-10 20:08 PlusBei 阅读(19) 评论(0) 推荐(0)
摘要: 深入浅出 ZooKeeper ZooKeeper 是一个分布式协调服务 ,由 Apache 进行维护。 ZooKeeper 可以视为一个高可用的文件系统。 ZooKeeper 可以用于发布/订阅、负载均衡、命令服务、分布式协调/通知、集群管理、Master 选举、分布式锁和分布式队列等功能 。 一、 阅读全文
posted @ 2025-06-12 19:48 PlusBei 阅读(26) 评论(0) 推荐(0)