谈谈 InnoDB引擎中的一些索引策略

如果我们在工作能够更好的利用好索引，那将会极大的提升数据库的性能。

覆盖索引

覆盖索引是指在普通索引树中可以得到查询的结果，不需要在回到主键索引树中再次搜索

建立如下这张表来演示覆盖索引：

create table T (
    id int primary key,
    age int NOT NULL DEFAULT 0,
    name varchar(16) NOT NULL DEFAULT '',
    index age(age))
    engine=InnoDB;

我们执行select * from T where age between 13 and 25 语句，这条语句的执行流程大概为：

1、在 age 索引树中查找到 age = 13 的记录，取得 id 的值

2、根据 id 的值在主键索引上查找所需要的所有信息

3、在 age 索引树从上往下取，重复 1、2 两步操作，直到 age 不符合条件为止。

如果我们将语句换为 select id from T where age between 13 and 25，执行这条语句时，在 age 索引树上就可以查询到 id 的值，省去了上面的回表操作，这样就减少了搜索次数，提升了查询效率。

这时候的 age 索引树已经可以满足我们的查询需求，age 索引就称为覆盖索引。

覆盖索引是常用的数据查询优化技术，可以极大的提升数据库性能，有以下几个原因：

减少树的搜索次数，显著提升查询性能
索引是按照值的顺序存储，所以对于 I/O 密集型的范围查询比随机从磁盘中读取每一行的 I/O 要少很多
索引的条目远小于数据的条目，在索引树上读取会极大的减小数据库的访问量

最左前缀原则

最左前缀原则是建立在联合索引之上的，如果我们建立了联合索引，我们不需要使用索引的全部定义，只要用到了索引中的最左边的那个字段就可以使用这个索引，这就是 B-tree 索引支持最左前缀原则。

建立如下这张表来解释最左前缀原则：

create table T (
    id int primary key,
    age int NOT NULL DEFAULT 0,
    name varchar(16) NOT NULL DEFAULT '',
    ismale tinyint(1) DEFAULT NULL,
    email varchar(64),
    address varchar(255),
    KEY `name_age` (`name`,`age`))
    engine=InnoDB;

我们建立了联合索引 name_age，现在，假设我们有以下三种查询情景：

1、查出用户名的第一个字是“张”开头的人的年龄。即查询条件子句为"where name like '张%'"

2、查处用户名中含有“张”字的人的年龄。即查询条件子句为"where name like '%张%'"

3、查出用户名以“张”字结尾的人的年龄。即查询条件子句为"where name like '%张'"

在这三种情况中，第一种情况可以利用到 name_age 这个联合索引，加速查询，可以看出，我们并没有使用索引的全部定义，只要满足最左前缀，就可以利用索引来加速检索。这个最左前缀可以是联合索引的最左 N 个字段，也可以是字符串索引的最左 M 个字符。

如果我们将索引的顺序调整为KEYname_age(age,name) ，那么上面三种情况都使用不到这个联合索引。

维护索引需要代价，所以有时候我们可以利用“最左前缀”原则减少索引数量。

索引下推

索引下推优化是 MySQL 5.6 引入的，可以在索引遍历过程中，对索引中包含的字段先做判断，直接过滤掉不满足条件的记录，减少回表次数。

建立如下这张表来解释索引下推：

create table T (
    id int primary key,
    age int NOT NULL DEFAULT 0,
    name varchar(16) NOT NULL DEFAULT '',
    ismale tinyint(1) DEFAULT NULL,
    email varchar(64),
    address varchar(255),
    KEY `name_age` (`name`,`age`))
    engine=InnoDB;

在表中建立了 name、age 的联合索引，我们执行 select * from T where name like '张%' and age=10 and ismale=1;语句，「我们已经知道了B-tree 索引的最左前缀原则，所以将会用到 name_age 索引，因为索引下推优化，会在 name_age 索引树上判断 name 和 age 是否满足」。

根据我们上面的执行语句，会在 name_age 索引树上查找 name 以 '张' 开头的并且 age = 10 的数据，然后在回到主键索引树中查询所需要的信息，并不是所有 name_age 索引树上查找 name 以 '张' 开头的数据都回主键索引树中查询数据，这样就减少了一些不必要的查询。

假设我们的数据如下图所示：

在 name_age 索引树中有四条符合 name 以 '张'开头的数据，如果没有索引下推，则需要回到主键索引树上判断 age 是否等于 10 ，这样就需要回表四次，而有了索引下推之后，在 name_age 索引树上就判断 age 是否等于 10 ，只需要回表两次，这样就减少了回表次数，提升了查询性能。

posted @ 2020-02-02 15:04 murphy_gb 阅读(381) 评论(0) 收藏举报

刷新页面返回顶部

murphy_gb

谈谈 InnoDB引擎中的一些索引策略

覆盖索引

最左前缀原则

索引下推

公告