mysql优化-group by

一、group by 执行过程

select a,count(*) as cnt from t group by a 假设a上面没有索引

执行过程：

创建临时表，有两个字段a,cnt 且a为主键
遍历表t，假设记录为R，查看临时表中，是否有a=R.a的记录，没有就新增一条，有就cnt+1
临时表按cnt排序
返回临时表

当临时表数据大小<tmp_table_size 时，用的是内存，超过这个大小就会用磁盘

select a,count(*) as cnt from t group by a 假设a上面有索引

执行过程：

由于a上面有索引，所以a是有序的，直接从a的索引树的第一个叶子节点开始遍历
假设a的值是1 1 2 3 3 ，当遍历到第一个2时，就知道有2个1，遍历到第一个3时，就知道有一个2
遍历完直接返回结果，不用临时表

二、优化

如果对 group by 语句的结果没有排序要求，要在语句后面加 order by null；（mysql 默认会对group by 按分组字段排序（c1,c2,c3...））
尽量避免使用临时表，所以要对group by 的字段加上索引
有些情况不能给group by 字段加索引，必须使用临时表，这个时候就要考虑尽量使用内存临时表，当数据量不大时，可以适当调大tmp_table_size ，当数据量很大时，也不用让mysql先去用内存临时表试一下大小够不够了，直接告诉mysql数据量很大，直接用磁盘临时表，select 加上SQL_BIG_RESULT

posted @ 2022-03-14 22:05 hugeQAQ 阅读(560) 评论(0) 收藏举报

刷新页面返回顶部