摘要: 刚入职新公司,领导说:这20台服务器你来管。 然后甩给我一个Excel表格,里面就写了IP和密码,其他啥都没有。 前任留下的文档?不存在的。 分享一下我是怎么快速上手的。 Day 1:摸清家底 第一步:能登上去 先确认所有服务器都能SSH上去。 # 写个脚本批量测试 for ip in $(cat 阅读全文
posted @ 2025-12-22 14:53 花宝宝 阅读(12) 评论(0) 推荐(0)
摘要: 折腾HomeLab两年多了,从最开始的树莓派到现在的小主机,分享一下我的配置。 什么是HomeLab 简单说就是在家里搭一套服务器环境,用来: 学习各种技术(Docker、K8s、网络) 跑一些自用服务(NAS、下载机、智能家居) 代替各种云服务(省钱+隐私) 我的设备清单 主力机:小主机 项目 配 阅读全文
posted @ 2025-12-22 14:16 花宝宝 阅读(24) 评论(0) 推荐(1)
摘要: 周三下午,正在摸鱼,突然钉钉群里炸了: [告警] 订单服务 POD重启 [告警] 订单服务 POD重启 [告警] 订单服务 POD重启 3个Pod连续重启,打开监控一看,内存直接打满然后被K8s杀掉了。 经典的OOM。 现象 服务:订单服务(Java,Spring Boot) 部署:K8s,3个Po 阅读全文
posted @ 2025-12-22 11:03 花宝宝 阅读(50) 评论(0) 推荐(1)
摘要: 上周五晚上10点,正准备关电脑下班,收到一条告警:服务器CPU 100%。 点开一看,好家伙,被挖矿了。 记录一下整个排查和处理过程,希望对大家有帮助。 发现异常 告警内容: [CRITICAL] 生产服务器 192.168.1.100 CPU使用率 99.8% 持续时间:15分钟 第一反应:难道是 阅读全文
posted @ 2025-12-22 11:03 花宝宝 阅读(21) 评论(0) 推荐(0)
摘要: 上个月接到个任务,把公司的MySQL从阿里云迁移到自建机房。听起来简单,mysqldump导出导入不就完了? 结果折腾了整整一周,踩了无数坑。记录一下,给后来人避雷。 背景 原来的数据库在阿里云RDS,配置是4核8G,数据量大概200G。要迁移到公司自建机房的物理服务器上。 要求: 停机时间控制在3 阅读全文
posted @ 2025-12-22 09:17 花宝宝 阅读(15) 评论(0) 推荐(0)