MySQL实战45讲学习笔记：第四讲

一、索引模型

1、索引的作用：

索引的出现其实是为了提高数据查询的效率，就像书的目录一样

提高数据查询效率

2、索引模型的优缺点比较

二、InnoDB索引模型

1、二叉树是搜索效率最高的，但是实际上大多数的数据库存储却并不适用二叉树？

1、其原因是，索引不止在内存中，还要写到磁盘上

2、N叉树由于在读写上的性能优点，以及适配磁盘的访问模式，已经被广泛应用在数据库引擎中了

3、数据库底层存储的核心就是基于这些数据模型的，每碰到一个新数据库，我们需要先关注它的数据模型，这样才能从离乱山给分析出数据库的适应场景

4、不同存储引擎的索引的工作方式并不一样，而即使多个存储引擎支持同一类型的索引，其底层的实现也可能不同

由于InnoDB存储引擎在MySQL数据库中使用最为广泛，所以下面我就以为例，和你分析一下其中的索引模型

2、索引类型

主键索引：主键索引的叶子节点存的是整行的数据(聚簇索引)，

非主键索引：非主键索引的叶子节点内容是主键的值(二级索引)

3、主键索引和普通索引的区别：

1、主键索引只要搜索ID这个B+Tree即可拿到数据。

如果语句是 select * from T where ID=500，即主键查询方式，则只需要搜索 ID 这棵 B+ 树

2、普通索引先搜索索引拿到主键值，再到主键索引树搜索一次(回表)

如果语句是 select * from T where k=k=5，即普通索引查询方式，则需要先搜索 k 索引树，得到到 ID 的值为 500，再到 ID 索引树搜索一次。这个过程为回表

也就是说，基于非主键索引的查询需要多扫描一棵树，因此，我们在应用中应该尽量使用主键查询

三、索引维护

1、什么是自增主键

自增主键是指自增列上定义的主键，插入新记录的时候可以不制定ID的值，系统会获取当前ID最大值加1作为下一条记录的ID值

也就是说，自增主键的插入数据模式，正符合我们前面提到的递增插入的场景。每次插入一条新记录，都是追加操作，都不涉及到挪动其他记录，也不会触发叶子节点的分裂

2、数据也满了怎么办？

一个数据页满了，按照B+Tree算法，新增加一个数据页，叫做页分裂，会导致性能下降。空间利用率降低大概50%。

当相邻的两个数据页利用率很低的时候会做数据页合并，合并的过程是分裂过程的逆过程。

分裂合并示意图

3、主键长度越小，普通索引的叶子节点就越小，普通索引占用的空间也就越小

由于每个非主键索引的叶子节点上都有主键的值，

1、如果用身份证号做主键，那么每个二级索引的叶子节点占用的20个字节，

2、而如果用整型做主键，则只要4个字节，

3、如果是长整型则是8个字节

从性能和存储空间方面考量，自增主键往往是更合理的选择。

4、什么场景适合直接用业务字段直接做主键？

1、只有一个索引；

2、改索引必须是唯一索引。

你一定看出来了，这就是典型的KV场景

由于没有其他索引，所以也就不用考虑其他索引的叶子节点大小的问题

这时候我们就要有限考虑上一段的“尽量使用主键查询”原则，直接将这个索引设置为主键，可以避免每次查询需要搜索两棵树

posted @ 2019-03-06 16:56 活的潇洒80 阅读(1537) 评论(1) 收藏举报

刷新页面返回顶部

运维人生