摘要: 熟悉InfiniBand(IB)和RDMA over Converged Ethernet(RoCE)网络的配置和优化。有成功部署和管理cube-studio的直接经验。容器编排(Kubernetes, Docker)、调度系统(Volcano, Kubeflow)、监控工具(Prometheus, 阅读全文
posted @ 2025-02-17 22:29 滴滴滴 阅读(48) 评论(0) 推荐(0)
摘要: [https://pandagpt.io](https://pandagpt.io) 1、 运维故障复盘,进行技术改进,开复盘会。PDCA改进运维方法。 2、 深度:关键运维技术进行难点进行攻克,在测试环境进行测试验证,在生产环境执行。指导其他运维进行难点问题处理。 3、 高度:对公司关键运维技术难 阅读全文
posted @ 2023-04-24 13:44 滴滴滴 阅读(302) 评论(0) 推荐(0)
摘要: 自定义 DNS 服务 本页说明如何配置 DNS Pod,以及定制集群中 DNS 解析过程。 准备开始 你必须拥有一个 Kubernetes 的集群,同时你的 Kubernetes 集群必须带有 kubectl 命令行工具。 建议在至少有两个节点的集群上运行本教程,且这些节点不作为控制平面主机。 如果 阅读全文
posted @ 2023-04-10 10:15 滴滴滴 阅读(779) 评论(0) 推荐(0)
摘要: 2022 09 11日开始坚持学会go语言 为了转型换个方向 rancher 部署三台 rac部署 1. 方向一 jenkins sornaqube jira 禅道集成 jenkins 方向二: k8s go开发 shell python编程方面 阅读全文
posted @ 2022-09-11 23:21 滴滴滴 阅读(94) 评论(0) 推荐(0)
摘要: 根据我的经验,大多数人(使用Helm或手动yaml)将应用程序部署到Kubernetes上,然后认为他们就可以一直稳定运行。然而并非如此,实际使用过程还是遇到了一些“陷阱”,我希望在此处列出这些“陷阱”,以帮助您了解在Kubernetes上启动应用程序之前需要注意的一些问题。 Kubernetes调 阅读全文
posted @ 2022-07-25 09:35 滴滴滴 阅读(154) 评论(0) 推荐(0)
摘要: 做事情要求有强烈的目标感 法不轻传,道不贱卖,师不顺路,医不叩门 阅读全文
posted @ 2020-07-20 12:18 滴滴滴 阅读(430) 评论(0) 推荐(0)
摘要: 记大纲 填充大纲下面知识点 填充例子 默写代码 对照笔记填充 TRANSLATE with x English Arabic Hebrew Polish Bulgarian Hindi Portuguese Catalan Hmong Daw Romanian Chinese Simplified 阅读全文
posted @ 2020-04-10 09:54 滴滴滴 阅读(314) 评论(0) 推荐(0)
摘要: https://pythonav.com/wiki/ 阅读全文
posted @ 2020-01-06 18:31 滴滴滴 阅读(2055) 评论(0) 推荐(0)
摘要: 五大富豪教你获得成功:巴菲特说“投资自己” 五大富豪教你获得成功:巴菲特说“投资自己” 不过分追求自由 和 不过分放纵欲望编译|米娜 在即将过去的2019年,全球亿万富翁的队伍继续壮大。目前约有2604位亿万富翁,约占地球总人口的0.0002%。用“凤毛麟角”来形容这些超级富豪,一点也不为过!虽然, 阅读全文
posted @ 2020-01-02 10:15 滴滴滴 阅读(378) 评论(0) 推荐(0)
摘要: 人一旦堕落,哪怕是短暂的几年,上帝就会以最快的速度,收走你的天赋和力量。 TRANSLATE with x English Arabic Hebrew Polish Bulgarian Hindi Portuguese Catalan Hmong Daw Romanian Chinese Simpl 阅读全文
posted @ 2018-09-04 11:17 滴滴滴 阅读(345) 评论(0) 推荐(0)
摘要: containerd配置镜像加速 配置文档:github.com/containerd/… 镜像源收集地址:github.com/DaoCloud/pu… 1.修改/etc/containerd/config.toml配置文件 指定config_path的目录 [root@master certs. 阅读全文
posted @ 2026-03-03 14:18 滴滴滴 阅读(29) 评论(0) 推荐(0)
摘要: 前言:本次CNI插件配置有很多问题,最头疼的一点就是Docker拉取容器的官网被墙了,然后即使能登录官网calico所需要的容器也报404网页丢失,这次使用的Kubernetes为 v1.29.14 版本,calico为 v3.29.2 版本。 1,calico.yaml下载命令为(依然需要访问Gi 阅读全文
posted @ 2026-02-28 16:24 滴滴滴 阅读(17) 评论(0) 推荐(0)
摘要: 在 Ubuntu 上部署 Kubernetes 1.35(代号 "Timbernetes",于2025年12月发布)需要特别注意该版本的一个重大变更:完全移除了对 cgroup v1 的支持。这意味着你的 Ubuntu 系统必须启用 cgroup v2,且推荐使用 Ubuntu 22.04 LTS  阅读全文
posted @ 2026-02-28 14:39 滴滴滴 阅读(39) 评论(0) 推荐(0)
摘要: 维度哨兵模式 (Sentinel)集群模式 (Cluster)胜出者 数据量 < 单机内存上限 (如 64GB/128GB) > 单机内存上限,需 TB 级存储 按需选择 写吞吐量 受限于单主节点性能 可随节点数线性增长 Cluster 读吞吐量 可从从节点扩展读,但写是瓶颈 多主节点并行处理,读写 阅读全文
posted @ 2026-02-25 15:40 滴滴滴 阅读(22) 评论(0) 推荐(0)
摘要: 什么是tinitini 是一个小型的守护进程初始化系统,主要用于容器环境下作为 PID 为 1 的 init 进程。在 Linux 系统中,PID(进程标识符)为 1 的进程具有特殊的意义,它是系统的第一个进程,也称为 init 进程,负责创建、管理和终止其他所有进程,并且能够正确地处理和转发信号给 阅读全文
posted @ 2026-02-10 14:53 滴滴滴 阅读(34) 评论(0) 推荐(0)
摘要: 在现代计算机系统中,存储空间似乎总是无尽的,但当你突然看到“No space left on device”的错误消息时,那种突然的焦虑感可不是开玩笑的。这就像是你在一个精心设计的房间里忽然发现最后一块空地也被填满了——这时候你会发现,问题不仅仅是空间的缺乏,而是背后隐藏的一系列复杂因素。今天,我们 阅读全文
posted @ 2026-02-09 16:52 滴滴滴 阅读(16) 评论(0) 推荐(0)
摘要: 方法 1:增加 Partition 数量(推荐) 假设你将 Topic 的 Partition 数设为 9 个; 那么在理想情况下,Kafka 可以将 Partition 分配为: C1(8M/s)→ 4 个 Partition C2(5M/s)→ 3 个 Partition C3(2M/s)→ 2 阅读全文
posted @ 2026-02-05 16:20 滴滴滴 阅读(33) 评论(0) 推荐(0)
摘要: 好的,这是一个关于 Kafka 消费者组重新均衡的详细解释。 **重新均衡(Rebalance)** 是 Kafka 消费者组实现高可用、可扩展和容错的核心机制。它的核心目标是:**在消费者组内消费者数量发生变化或订阅主题的分区数量发生变化时,重新、公平地分配分区所有权,确保每个分区在同一时刻只被组 阅读全文
posted @ 2026-02-03 10:14 滴滴滴 阅读(13) 评论(0) 推荐(0)
摘要: 写入测试(清除缓存) bash # 清除缓存 sync; echo 3 > /proc/sys/vm/drop_caches # 测试写入(50MB文件) dd if=/dev/zero of=/nfs_mount/testfile bs=1M count=50 oflag=direct conv= 阅读全文
posted @ 2025-12-18 16:25 滴滴滴 阅读(11) 评论(0) 推荐(0)
摘要: 将两个问题结合起来,就构成了您所描述的完整故障链: 不规范下线导致节点 NotReady -> nodeSelector 将新Pod持续调度到这些 NotReady 节点 -> Pod永远 Pending -> Deployment控制器为达成目标,陷入“创建-删除-替换”的无限循环 -> 循环产生 阅读全文
posted @ 2025-12-16 10:46 滴滴滴 阅读(12) 评论(0) 推荐(0)