会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
xhzhang
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
8
下一页
2025年12月25日
TCP连接问题排查手册:从握手超时到连接泄漏
摘要: 前言 做后端这些年,TCP相关的问题排查过无数次。连接超时、连接被重置、端口耗尽、TIME_WAIT堆积……每种问题都有自己的套路。 这篇文章把我遇到过的典型问题和排查方法整理一下。不讲TCP协议原理(那个网上一搜一大把),就讲实际怎么定位、怎么解决。 工具准备 先说清楚用什么工具: # 连接状态统
阅读全文
posted @ 2025-12-25 16:39 花宝宝
阅读(204)
评论(0)
推荐(0)
2025年12月23日
MySQL索引设计避坑指南:这些错误别再犯了
摘要: 同事写了个SQL,生产环境跑了8秒,被DBA追着骂。 一看执行计划,全表扫描,100万行数据一行行扫。 "不是加了索引吗?" "加了,但没用上。" 索引这东西,加得不对比不加还糟糕。整理一下常见的索引坑。 一、索引失效的常见场景 1.1 对索引列做函数运算 -- 索引失效 SELECT * FROM
阅读全文
posted @ 2025-12-23 13:48 花宝宝
阅读(23)
评论(0)
推荐(0)
故障演练与混沌工程入门:在生产环境搞破坏
摘要: "生产环境能不能搞故障演练?" 这问题问老板,老板肯定说不行。但Netflix、Google都在生产环境搞,而且搞得很凶。 区别在于:有准备的搞破坏叫演练,没准备的叫事故。 为什么要故障演练 真实案例: 双十一前一个月,我们信心满满,觉得系统扛得住。结果当天: Redis主节点挂了,failover
阅读全文
posted @ 2025-12-23 11:37 花宝宝
阅读(40)
评论(0)
推荐(0)
服务降级与熔断机制实战:让系统优雅地挂
摘要: 促销活动开始10分钟,商品服务挂了。 然后呢?订单服务调商品服务超时,线程池打满。用户服务调订单服务超时,线程池也打满。整个系统像多米诺骨牌一样全倒了。 这就是经典的雪崩效应。 解决方案:熔断和降级。 雪崩是怎么发生的 用户请求 │ ▼ ┌─────────┐ 调用 ┌─────────┐ 调用 ┌
阅读全文
posted @ 2025-12-23 11:32 花宝宝
阅读(19)
评论(0)
推荐(0)
Nginx限流防刷与CC攻击防护实战配置
摘要: 做过Web服务的都知道,接口裸奔是找死。 不设防的后果:羊毛党刷爆优惠券、爬虫拖垮服务器、CC攻击搞瘫业务。 整理一下Nginx层面的防护方案,都是生产环境验证过的配置。 一、限流基础 Nginx有两个核心限流模块: ngx_http_limit_req_module:限制请求速率 ngx_http
阅读全文
posted @ 2025-12-23 10:01 花宝宝
阅读(42)
评论(0)
推荐(0)
Linux内核参数调优实战:生产环境性能翻倍
摘要: 上周线上服务扛不住流量,运维群里一顿排查,最后发现是内核参数没调。 默认配置跑个开发环境还行,生产环境就是在给自己挖坑。 把这次调优过程记录一下,都是踩过的坑。 背景 我们有台服务器,配置不差: 32核CPU 64G内存 万兆网卡 但是一到高峰期,CPU才30%,连接数就上不去了,大量请求超时。 看
阅读全文
posted @ 2025-12-23 09:23 花宝宝
阅读(49)
评论(0)
推荐(1)
2025年12月22日
新人入职,我是怎么快速接手20台服务器的
摘要: 刚入职新公司,领导说:这20台服务器你来管。 然后甩给我一个Excel表格,里面就写了IP和密码,其他啥都没有。 前任留下的文档?不存在的。 分享一下我是怎么快速上手的。 Day 1:摸清家底 第一步:能登上去 先确认所有服务器都能SSH上去。 # 写个脚本批量测试 for ip in $(cat
阅读全文
posted @ 2025-12-22 14:53 花宝宝
阅读(12)
评论(0)
推荐(0)
我的HomeLab配置清单,花了不到3000
摘要: 折腾HomeLab两年多了,从最开始的树莓派到现在的小主机,分享一下我的配置。 什么是HomeLab 简单说就是在家里搭一套服务器环境,用来: 学习各种技术(Docker、K8s、网络) 跑一些自用服务(NAS、下载机、智能家居) 代替各种云服务(省钱+隐私) 我的设备清单 主力机:小主机 项目 配
阅读全文
posted @ 2025-12-22 14:16 花宝宝
阅读(24)
评论(0)
推荐(1)
记一次线上OOM排查,JVM调优全过程
摘要: 周三下午,正在摸鱼,突然钉钉群里炸了: [告警] 订单服务 POD重启 [告警] 订单服务 POD重启 [告警] 订单服务 POD重启 3个Pod连续重启,打开监控一看,内存直接打满然后被K8s杀掉了。 经典的OOM。 现象 服务:订单服务(Java,Spring Boot) 部署:K8s,3个Po
阅读全文
posted @ 2025-12-22 11:03 花宝宝
阅读(50)
评论(0)
推荐(1)
服务器被黑了,我是怎么发现和处理的
摘要: 上周五晚上10点,正准备关电脑下班,收到一条告警:服务器CPU 100%。 点开一看,好家伙,被挖矿了。 记录一下整个排查和处理过程,希望对大家有帮助。 发现异常 告警内容: [CRITICAL] 生产服务器 192.168.1.100 CPU使用率 99.8% 持续时间:15分钟 第一反应:难道是
阅读全文
posted @ 2025-12-22 11:03 花宝宝
阅读(21)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
8
下一页
公告