摘要:
同事写了个SQL,生产环境跑了8秒,被DBA追着骂。 一看执行计划,全表扫描,100万行数据一行行扫。 "不是加了索引吗?" "加了,但没用上。" 索引这东西,加得不对比不加还糟糕。整理一下常见的索引坑。 一、索引失效的常见场景 1.1 对索引列做函数运算 -- 索引失效 SELECT * FROM 阅读全文
posted @ 2025-12-23 13:48
花宝宝
阅读(23)
评论(0)
推荐(0)
摘要:
"生产环境能不能搞故障演练?" 这问题问老板,老板肯定说不行。但Netflix、Google都在生产环境搞,而且搞得很凶。 区别在于:有准备的搞破坏叫演练,没准备的叫事故。 为什么要故障演练 真实案例: 双十一前一个月,我们信心满满,觉得系统扛得住。结果当天: Redis主节点挂了,failover 阅读全文
posted @ 2025-12-23 11:37
花宝宝
阅读(40)
评论(0)
推荐(0)
摘要:
促销活动开始10分钟,商品服务挂了。 然后呢?订单服务调商品服务超时,线程池打满。用户服务调订单服务超时,线程池也打满。整个系统像多米诺骨牌一样全倒了。 这就是经典的雪崩效应。 解决方案:熔断和降级。 雪崩是怎么发生的 用户请求 │ ▼ ┌─────────┐ 调用 ┌─────────┐ 调用 ┌ 阅读全文
posted @ 2025-12-23 11:32
花宝宝
阅读(19)
评论(0)
推荐(0)
摘要:
做过Web服务的都知道,接口裸奔是找死。 不设防的后果:羊毛党刷爆优惠券、爬虫拖垮服务器、CC攻击搞瘫业务。 整理一下Nginx层面的防护方案,都是生产环境验证过的配置。 一、限流基础 Nginx有两个核心限流模块: ngx_http_limit_req_module:限制请求速率 ngx_http 阅读全文
posted @ 2025-12-23 10:01
花宝宝
阅读(42)
评论(0)
推荐(0)
摘要:
上周线上服务扛不住流量,运维群里一顿排查,最后发现是内核参数没调。 默认配置跑个开发环境还行,生产环境就是在给自己挖坑。 把这次调优过程记录一下,都是踩过的坑。 背景 我们有台服务器,配置不差: 32核CPU 64G内存 万兆网卡 但是一到高峰期,CPU才30%,连接数就上不去了,大量请求超时。 看 阅读全文
posted @ 2025-12-23 09:23
花宝宝
阅读(49)
评论(0)
推荐(1)

浙公网安备 33010602011771号