会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
https://www.cnblogs.com/wanghongwei-dev
欢迎来到本博客,本博客多为部署和配置文档用于查询使用,并用于记录故障处理。
博客园
首页
新随笔
联系
订阅
管理
[置顶]
汇总Linux系统运维中遇到的问题
摘要: 汇总Linux系统运维中遇到的问题 1、fdisk 磁盘分区报错 GPT PMBR size mismatch (20971519 != 83886079) will be corrected by w(rite). GPT PMBR size mismatch (20971519 != 83886
阅读全文
posted @ 2023-05-19 19:13 wanghongwei-dev
阅读(850)
评论(0)
推荐(0)
[置顶]
汇总Kubernetes运维中遇到的问题
摘要: 汇总Kubernetes运维中遇到的问题 1、挂载卷权限问题导致pod运行异常 # 调试:增加command字段,进入容器查看应用运行uid spec: containers: - command: - /bin/sh - -c - sleep 500000 # 使用initContainer修改目
阅读全文
posted @ 2023-04-17 09:33 wanghongwei-dev
阅读(519)
评论(0)
推荐(0)
[置顶]
汇总OpenStack运维中遇到的问题
摘要: 汇总OpenStack运维中遇到的问题 1.冷迁移和升降配 # 1.配置各计算节点nova用户免密互信 usermod -s /bin/bash nova echo "NOVA_PASS"|passwd --stdin nova su - nova ssh-keygen -t rsa -N '' -
阅读全文
posted @ 2022-06-07 19:38 wanghongwei-dev
阅读(1103)
评论(0)
推荐(0)
[置顶]
汇总Ceph运维中遇到的问题
摘要: 汇总Ceph运维中遇到的问题 1. 更换故障盘 1.1 查看故障盘osd id ceph osd tree 1.2 移除故障盘 ceph osd out osd.60 ceph osd crush remove osd.60 ceph auth del osd.60 ceph osd rm osd.
阅读全文
posted @ 2022-05-30 13:45 wanghongwei-dev
阅读(678)
评论(0)
推荐(0)
2026年3月9日
基于Kubernetes Python Client的资源操作模块
摘要: 以下是一个基于 Kubernetes Python Client 的可复用模块,支持对任意 Kubernetes 资源(内置资源与 CRD)进行增删改查操作。模块使用 dynamic client 实现,自动处理 API 组和版本,同时提供了常见资源的版本映射简化调用。 核心模块 """ Kuber
阅读全文
posted @ 2026-03-09 17:08 wanghongwei-dev
阅读(1)
评论(0)
推荐(0)
2026年3月4日
在RHEL 9.4上使用cephadm部署Ceph集群指南
摘要: 在 RHEL 9.4 上使用 cephadm 部署 Ceph 集群指南 重要说明:RHEL 9.4 与 Ceph 的兼容性 根据 Red Hat 官方文档,Red Hat Ceph Storage 6.x 及更高版本完全支持 RHEL 9.4 作为主机操作系统 。集群中的所有节点必须使用相同版本的操
阅读全文
posted @ 2026-03-04 11:07 wanghongwei-dev
阅读(9)
评论(0)
推荐(0)
2026年3月3日
Ceph生产最佳实践存储方案(通用虚拟化/私有云场景)
摘要: Ceph生产最佳实践存储方案(通用虚拟化/私有云场景) 一、方案整体定位 适用场景:企业私有云、虚拟化平台(VMware/OpenStack/KVM)、容器云存储、通用文件 / 对象存储 核心原则:稳定优先、性能达标、成本可控、运维极简 架构选型:3 节点起步(最小生产集群)、3 副本保障可靠性、B
阅读全文
posted @ 2026-03-03 14:40 wanghongwei-dev
阅读(25)
评论(0)
推荐(0)
2026年2月26日
Linux策略路由配置的多种实现方式
摘要: Linux策略路由配置的多种实现方式 示例环境: 普通宽带访问互联网(默认):eth0,10.0.0.2/24 网关10.0.0.1 企业专线:eth1,20.0.0.2/24 网关 20.0.0.1 重要业务(要走专线): 目标网段 192.168.10.0/24(ERP) 目标网段 192.16
阅读全文
posted @ 2026-02-26 13:33 wanghongwei-dev
阅读(15)
评论(0)
推荐(0)
2026年2月24日
ArgoCD部署与核心配置详解及生产最佳实践
摘要: 引言 ArgoCD 是 Kubernetes 生态中最受欢迎的 GitOps 持续交付工具,它通过将应用声明式配置存储在 Git 仓库中,并自动同步到集群,实现了“Git 作为单一事实来源”的交付模式。本文记录了 ArgoCD 的实际安装过程,并深入解析了创建应用时涉及的四大类核心配置项(GENER
阅读全文
posted @ 2026-02-24 23:02 wanghongwei-dev
阅读(52)
评论(0)
推荐(0)
2026年2月15日
Kubernetes Operator 入门开发指南
摘要: Kubernetes Operator 入门开发指南 使用 Python 和 Kopf 框架编写一个简单的 Kubernetes Operator。我们将创建一个名为 WebSite 的自定义资源,当用户创建该资源时,Operator 会自动为其创建一个 Deployment 和一个 Service
阅读全文
posted @ 2026-02-15 00:39 wanghongwei-dev
阅读(3)
评论(0)
推荐(0)
Prometheus Exporter 入门开发指南
摘要: Prometheus Exporter 入门开发指南 一、文档概述 Prometheus Exporter 是暴露监控指标的小程序,核心作用是将自定义的业务 / 系统指标转换为 Prometheus 能识别的格式,并通过 HTTP 接口(默认 /metrics)提供给 Prometheus 抓取,是
阅读全文
posted @ 2026-02-15 00:39 wanghongwei-dev
阅读(10)
评论(0)
推荐(0)
2026年2月12日
一次ssh无法连接服务器故障处理报告
摘要: 1. 问题描述与分析 1.1 问题背景 产品/平台: 开发中心操作系统切换平台 内核版本: 4.19.90(宿主机与虚拟机一致) 问题概述: SSH连接目标服务器时随机出现连接超时,复现时间不明确,但可通过重启目标服务器的sshd服务临时恢复。 接手时间: 2025年5月7日 1.2 问题现象与分析
阅读全文
posted @ 2026-02-12 09:55 wanghongwei-dev
阅读(8)
评论(0)
推荐(0)
2026年2月6日
Kubernetes 1.24+集群管理员权限Token获取手册
摘要: Kubernetes 1.24+集群管理员权限Token获取手册 一、核心前提(K8s 1.24+ 关键变化) K8s 1.24及以上版本(含1.35),ServiceAccount 不再自动生成包含Token的Secret,需手动创建 Secret 关联 ServiceAccount 才能生成可用
阅读全文
posted @ 2026-02-06 17:05 wanghongwei-dev
阅读(6)
评论(0)
推荐(0)
GitLab及配套工具部署配置手册
摘要: GitLab及配套工具部署配置手册 一、Docker 方式部署 GitLab CE 1. 定义数据目录并创建子目录 # 定义GitLab数据根目录 GITLAB_HOME=/opt/gitlab # 创建配置、日志、数据子目录 mkdir -p $GITLAB_HOME/config $GITLAB
阅读全文
posted @ 2026-02-06 16:48 wanghongwei-dev
阅读(7)
评论(0)
推荐(0)
下一页
公告