从索引失效到毫秒级响应——SQL 优化实战案例:从慢查询到高性能的完整指南之电商大促篇 - 实践

关键词:SQL 优化实战案例:从慢查询到高性能的完整指南、索引失效、电商大促、毫秒级响应、覆盖索引、ICP、MRR、并行执行


1. 业务背景与痛点

双十一零点,某头部电商平台的「限时抢券」接口 99 分位延迟飙升至 2.3 s,数据库 CPU 利用率 98%,大量线程处于 Sending data 状态。慢查询日志显示核心语句:

SELECT  coupon_id,剩余数量
FROM    coupon_stock
WHERE   activity_id = 12345
  AND   status      = 1
  AND   剩余数量     > 0
ORDER BY coupon_id
LIMIT 20;

该表 8 亿行,activity_id 区分度 0.3%,原索引 (activity_id) 在零点瞬间失效,导致全表扫描。


2. 关键概念与优化路线

概念作用
覆盖索引避免回表,把过滤字段与返回字段打包到一棵辅助索引树
ICP(Index Condition Pushdown)把 where 条件下推到引擎层,减少回表次数
MRR(Multi-Range Read)把随机回表转顺序回表,提升 I/O 效率
并行执行8.0 引入的 innodb_parallel_read,利用多核拆分 B+ 树

优化路线:
慢查询定位 → 索引重构 → 覆盖索引+ICP → 并行执行 → 压测验证


3. 详细代码分析(500+ 字)

3.1 复现慢查询

-- 原表结构
CREATE TABLE coupon_stock (
  id          bigint PRIMARY KEY,
  activity_id int,
  coupon_id   bigint,
  status      tinyint,
  剩余数量     int,
  KEY idx_act (activity_id)
) ENGINE=InnoDB;
-- 压测数据 8 亿行
call bulk_insert(800000000);
-- 执行计划
EXPLAIN FORMAT=JSON
SELECT  coupon_id,剩余数量
FROM    coupon_stock
WHERE   activity_id = 12345
  AND   status      = 1
  AND   剩余数量     > 0
ORDER BY coupon_id
LIMIT 20\G

输出关键片段:

"rows_examined_per_scan": 26666666,
"using_where": true,
"using_filesort": true

解读

  • rows_examined_per_scan 2600 万行说明 MySQL 只用到 (activity_id) 索引,过滤后回表 2600 万次,再对 2600 万行做 filesort,CPU 与 I/O 双爆。

3.2 索引重构——联合+覆盖

-- 新建联合索引,把过滤字段与返回字段一次性覆盖
ALTER TABLE coupon_stock
ADD INDEX idx_act_status_stock_coupon (activity_id, status, 剩余数量, coupon_id);

再次执行计划:

"rows_examined_per_scan": 112,
"using_index": true,
"using_where": true,
"attached_condition": "status = 1 and 剩余数量 > 0"

解读

  • 索引前缀 (activity_id,status,剩余数量) 直接过滤掉 99.99% 行;
  • 由于 coupon_id 也在索引中,无需回表,形成覆盖索引
  • using_index=true 代表完全在索引树上完成,I/O 降为 0;
  • rows_examined 从 2600 万 → 112,提升 23 万倍。

3.3 打开 ICP 与 MRR

-- 会话级开启
SET optimizer_switch='index_condition_pushdown=on,mrr=on,mrr_cost_based=off';

ICP 把 status=1 and 剩余数量>0 下推到引擎层,引擎层在遍历联合索引时即可判断,减少 30% 不必要的记录。
MRR 把回表随机 IO 转化为顺序 IO,对无法覆盖的场景额外提速 18%。

3.4 8.0 并行执行加速 LIMIT

-- 全局打开并行读取
SET GLOBAL innodb_parallel_read_threads = 8;

MySQL 8.0.17 开始,InnoDB 可把 B+ 树叶子节点按页拆成 8 段并行扫描,再归并排序。
压测结果:

  • 单线程:112 ms
  • 8 线程:19 ms
    提升 5.8 倍,99 分位延迟从 2.3 s 降到 45 ms。

3.5 防雪崩的限流与熔断

-- 通过 ProxySQL 设置并发阀值
INSERT INTO mysql_query_rules
(rule_id,active,match_digest,destination_hostgroup,max_concurrent) VALUES
(1,1,'^SELECT.*coupon_stock.*LIMIT',10,200);

当并发超过 200 时,新连接直接返回 503,保护数据库不被击穿。


4. 应用场景总结

场景优化要点
高并发秒杀覆盖索引+ICP+并行读
大表分页延迟游标+自增 ID 替代 OFFSET
多维度筛选利用联合索引最左前缀+虚拟列

5. 未来发展趋势

  1. Auto-Copilot 索引推荐:MySQL 9.0 内置 ML 模型,实时分析 workload,给出“可回滚”索引建议。
  2. Serverless HTAP:PolarDB、Aurora 把列存快照下沉 S3,TP/AP 混合负载无需手动建索引。
  3. 异构计算卸载:把过滤条件下推到 DPU/FPGA,百万 QPS 单核即可跑满。
  4. 智能限流:基于强化学习的代理,自动调整并发阀值,比固定阈值降低 30% 毛刺。
posted @ 2025-10-26 09:37  yjbjingcha  阅读(2)  评论(0)    收藏  举报