摘要: 汇总Linux系统运维中遇到的问题 1、fdisk 磁盘分区报错 GPT PMBR size mismatch (20971519 != 83886079) will be corrected by w(rite). GPT PMBR size mismatch (20971519 != 83886 阅读全文
posted @ 2023-05-19 19:13 wanghongwei-dev 阅读(850) 评论(0) 推荐(0)
摘要: 汇总Kubernetes运维中遇到的问题 1、挂载卷权限问题导致pod运行异常 # 调试:增加command字段,进入容器查看应用运行uid spec: containers: - command: - /bin/sh - -c - sleep 500000 # 使用initContainer修改目 阅读全文
posted @ 2023-04-17 09:33 wanghongwei-dev 阅读(519) 评论(0) 推荐(0)
摘要: 汇总OpenStack运维中遇到的问题 1.冷迁移和升降配 # 1.配置各计算节点nova用户免密互信 usermod -s /bin/bash nova echo "NOVA_PASS"|passwd --stdin nova su - nova ssh-keygen -t rsa -N '' - 阅读全文
posted @ 2022-06-07 19:38 wanghongwei-dev 阅读(1103) 评论(0) 推荐(0)
摘要: 汇总Ceph运维中遇到的问题 1. 更换故障盘 1.1 查看故障盘osd id ceph osd tree 1.2 移除故障盘 ceph osd out osd.60 ceph osd crush remove osd.60 ceph auth del osd.60 ceph osd rm osd. 阅读全文
posted @ 2022-05-30 13:45 wanghongwei-dev 阅读(678) 评论(0) 推荐(0)
摘要: 以下是一个基于 Kubernetes Python Client 的可复用模块,支持对任意 Kubernetes 资源(内置资源与 CRD)进行增删改查操作。模块使用 dynamic client 实现,自动处理 API 组和版本,同时提供了常见资源的版本映射简化调用。 核心模块 """ Kuber 阅读全文
posted @ 2026-03-09 17:08 wanghongwei-dev 阅读(1) 评论(0) 推荐(0)
摘要: 在 RHEL 9.4 上使用 cephadm 部署 Ceph 集群指南 重要说明:RHEL 9.4 与 Ceph 的兼容性 根据 Red Hat 官方文档,Red Hat Ceph Storage 6.x 及更高版本完全支持 RHEL 9.4 作为主机操作系统 。集群中的所有节点必须使用相同版本的操 阅读全文
posted @ 2026-03-04 11:07 wanghongwei-dev 阅读(9) 评论(0) 推荐(0)
摘要: Ceph生产最佳实践存储方案(通用虚拟化/私有云场景) 一、方案整体定位 适用场景:企业私有云、虚拟化平台(VMware/OpenStack/KVM)、容器云存储、通用文件 / 对象存储 核心原则:稳定优先、性能达标、成本可控、运维极简 架构选型:3 节点起步(最小生产集群)、3 副本保障可靠性、B 阅读全文
posted @ 2026-03-03 14:40 wanghongwei-dev 阅读(25) 评论(0) 推荐(0)
摘要: Linux策略路由配置的多种实现方式 示例环境: 普通宽带访问互联网(默认):eth0,10.0.0.2/24 网关10.0.0.1 企业专线:eth1,20.0.0.2/24 网关 20.0.0.1 重要业务(要走专线): 目标网段 192.168.10.0/24(ERP) 目标网段 192.16 阅读全文
posted @ 2026-02-26 13:33 wanghongwei-dev 阅读(15) 评论(0) 推荐(0)
摘要: 引言 ArgoCD 是 Kubernetes 生态中最受欢迎的 GitOps 持续交付工具,它通过将应用声明式配置存储在 Git 仓库中,并自动同步到集群,实现了“Git 作为单一事实来源”的交付模式。本文记录了 ArgoCD 的实际安装过程,并深入解析了创建应用时涉及的四大类核心配置项(GENER 阅读全文
posted @ 2026-02-24 23:02 wanghongwei-dev 阅读(52) 评论(0) 推荐(0)
摘要: Kubernetes Operator 入门开发指南 使用 Python 和 Kopf 框架编写一个简单的 Kubernetes Operator。我们将创建一个名为 WebSite 的自定义资源,当用户创建该资源时,Operator 会自动为其创建一个 Deployment 和一个 Service 阅读全文
posted @ 2026-02-15 00:39 wanghongwei-dev 阅读(3) 评论(0) 推荐(0)
摘要: Prometheus Exporter 入门开发指南 一、文档概述 Prometheus Exporter 是暴露监控指标的小程序,核心作用是将自定义的业务 / 系统指标转换为 Prometheus 能识别的格式,并通过 HTTP 接口(默认 /metrics)提供给 Prometheus 抓取,是 阅读全文
posted @ 2026-02-15 00:39 wanghongwei-dev 阅读(10) 评论(0) 推荐(0)
摘要: 1. 问题描述与分析 1.1 问题背景 产品/平台: 开发中心操作系统切换平台 内核版本: 4.19.90(宿主机与虚拟机一致) 问题概述: SSH连接目标服务器时随机出现连接超时,复现时间不明确,但可通过重启目标服务器的sshd服务临时恢复。 接手时间: 2025年5月7日 1.2 问题现象与分析 阅读全文
posted @ 2026-02-12 09:55 wanghongwei-dev 阅读(8) 评论(0) 推荐(0)
摘要: Kubernetes 1.24+集群管理员权限Token获取手册 一、核心前提(K8s 1.24+ 关键变化) K8s 1.24及以上版本(含1.35),ServiceAccount 不再自动生成包含Token的Secret,需手动创建 Secret 关联 ServiceAccount 才能生成可用 阅读全文
posted @ 2026-02-06 17:05 wanghongwei-dev 阅读(6) 评论(0) 推荐(0)
摘要: GitLab及配套工具部署配置手册 一、Docker 方式部署 GitLab CE 1. 定义数据目录并创建子目录 # 定义GitLab数据根目录 GITLAB_HOME=/opt/gitlab # 创建配置、日志、数据子目录 mkdir -p $GITLAB_HOME/config $GITLAB 阅读全文
posted @ 2026-02-06 16:48 wanghongwei-dev 阅读(7) 评论(0) 推荐(0)