mysql优化-group by

一、group by 执行过程

select a,count(*) as cnt from t group by a 假设a上面没有索引

执行过程:

  • 创建临时表,有两个字段a,cnt 且a为主键
  • 遍历表t,假设记录为R,查看临时表中,是否有a=R.a的记录,没有就新增一条,有就cnt+1
  • 临时表按cnt排序
  • 返回临时表

当临时表数据大小<tmp_table_size 时,用的是内存,超过这个大小就会用磁盘

select a,count(*) as cnt from t group by a 假设a上面有索引

执行过程:

  • 由于a上面有索引,所以a是有序的,直接从a的索引树的第一个叶子节点开始遍历
  • 假设a的值是1 1 2  3 3 ,当遍历到第一个2时,就知道有2个1,遍历到第一个3时,就知道有一个2
  • 遍历完直接返回结果,不用临时表

二、优化

  • 如果对 group by 语句的结果没有排序要求,要在语句后面加 order by null;(mysql 默认会对group by 按分组字段排序(c1,c2,c3...))
  • 尽量避免使用临时表,所以要对group by 的字段加上索引
  • 有些情况不能给group by 字段加索引,必须使用临时表,这个时候就要考虑尽量使用内存临时表,当数据量不大时,可以适当调大tmp_table_size ,当数据量很大时,也不用让mysql先去用内存临时表试一下大小够不够了,直接告诉mysql数据量很大,直接用磁盘临时表,select 加上SQL_BIG_RESULT 
posted @ 2022-03-14 22:05  hugeQAQ  阅读(512)  评论(0编辑  收藏  举报