MySQL高级3-索引的结构和分类

一、索引概述

　　1.1 索引的介绍

　　　　索引index：是帮助 Mysql 高效获取数据 的 有序的数据结构，在数据之外，数据库系统维护着的满足特定查找算法的数据结构，这些数据结构以某种方式引用(指向)数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引

　　1.2 索引的优缺点

- 优点1：提高数据检索的效率，降低数据库的IO成本
- 优点2：通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗
- 缺点1：索引列也要占磁盘空间。
- 缺点2：索引大大提高了查询效率，同时却也降低了更新表的速度，如对表进行insert，update，delete时，效率降低

二、索引结构

　　2.1 Mysql的索引常见结构

　　　　Mysql的索引是在储存引擎层实现的，不同的存储引擎有不同的结构，主要包含一下几种　

- B+树：最常见的索引类型，大部分引擎都支持B+树索引
- Hash索引：底层数据结构是用哈希表实现的，只有精确匹配索引的查询才有效，不支持范围查询

　　2.2 Mysql常见索引对不同引擎的支持

- B+树：InnoDB(支持)、MyISAM(支持)、Memory(支持)
- Hash索引：InnoDB(不支持)、MyISAM(不支持)、memory(支持)

　　2.3 二叉树实现索引的弊端

　　　　说明1：实际中的索引是没有使用二叉树的，因为二叉树具有一下的弊端　　

　　　　说明2：当顺序插入时，会形成一个链表，查询性能大大降低，大数据量的情况下，层级较深，检索速度慢。

　　　　说明3：特殊二叉树红黑树当做索引是，大数据量情况下，层级比较深，检索速度慢

　　2.4 B树实现索引的弊端

　　　　以一个最大度数（max-degree）为5（5阶）的b树为例（每个节点最多储存4个key，5个指针）

　　　　说明：B树的数据会存在每个节点上，而节点存在页(2.6 Mysql索引对B+树的优化有说明)上面，每页的大小为16K，这样每个页能存放的索引就比较少，导致同样数据体积小，层级要比B+树深。

　　2.5 B+树实现索引

　　　　以一个最大度数（max-degree）为4（4阶）的b+树为例

　　　　说明：对比较与B树

　　　　　　1、所有的数据都会出现在叶子节点上

　　　　　　2、叶子节点形成一个单向链表

　　2.6 Mysql索引对B+树的优化

　　　　Mysql索引数据结构对经典的B+树进行了优化，在原来的B+树基础上，增加了一个指向相邻叶子节点的链表指针，就行了带有顺序指针的B+树，提高了区间访问的性能

　　　　说明：每页在InnoDB中默认16K

　　2.7 hash索引

　　　　哈希索引就是采用一定的hash算法，将键值换成新的hash值，映射到对应的槽位上，然后储存在hash表中

　　　　说明：如果两个（或者多个）键映射到同一个槽位上，他们就产生了hash冲突，也称hash碰撞，可以通过链表来解决

　　2.8 hash索引特点

- hash索引只能用于对等比较（=，in），不支持范围查询（between,>,<）
- 无法利用索引完成排序操作
- 查询效率高，通常只需要一次检索就可以了，效率通常要高于B+树索引
- 在Mysql中，支持hash索引的事Memory引擎，而InnoDB中具有自适应hash功能，hash索引是存储引擎根据B+树索引在指定条件下自动构建的

　　2.9 InnoDB引擎选择B+树的优势

- 相对于二叉树，层级更少，搜索效率高
- 对于B树，无论是叶子节点还是非叶子节点，都会保存数据，这样导致一页中存储的键值减少，指针跟着减少，同样保存大量数据，只能增加树的高度，导致性能降低。
- 相对于hash索引，B+树支持范围匹配及排序操作

三、索引分类

　　3.1 主键索引

　　　　针对于表中主键创建的索引，默认自动创建，只能有一个，关键字：primary

　　3.2 唯一索引

　　　　避免同一个表中某数据列中的值重复，可以有多个，关键字：unique

　　3.3 常规索引

　　　　快速定位特定数据，可以有多个，

　　3.4 全文索引

　　　　全文索引查找的是文本中的关键字，而不是比较索引中的值，可以有多个，fulltext

　　3.5 聚集索引

　　　　在InnoDB中，根据索引的储存形式划分的，将数据储存与索引放到一起，索引结构的叶子节点保存了行数据，必须有，而且只有一个

- 如果存在主键，主键索引就是聚集索引
- 如果不存在主键，将使用第一个唯一（unique）索引作为聚集索引
- 如果表没有主键，也没有合适的唯一索引，则InnoDB会自动生成一个rowid作为隐藏的聚集索引

　　3.6 二级索引

　　　　在InnoDB中，根据索引的储存形式划分的，将数据与索引分开储存，索引结构的叶子节点关联的是对应的主键，可以存在多个

　　　　说明：聚集索引下面存放的是整行的数据，二级索引下面存放的对应的主键，要不然聚集索引下存放了整行数据，二级索引下也放整行数据，就会很冗余

　　3.7 回表查询

　　　　说明1：首先根据name字段走二级索引

　　　　说明2：找到Arm对应的id=10

　　　　说明3：然后再根据id=10找到对应的数据

　　　　说明4：整个过程也叫做回表查询

四、索引语法

　　4.1 查看索引

show index from 表名

　　　　示例：

mysql> show index from account;
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
| Table   | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment | Visible | Expression |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
| account |          0 | PRIMARY  |            1 | id          | A         |           4 |     NULL |   NULL |      | BTREE      |         |               | YES     | NULL       |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
1 row in set (0.00 sec)

　　　　说明：account 有一个主键索引

　　4.2 创建索引

create [unique | fulltext] index 索引名 on 表名(索引的列名, ..);

　　　　说明1：如果创建索引的字段是唯一的，值都不重复，可以加unique约束，说明这是一个唯一字段索引

　　　　说明2：fulltext 是全文检索索引，主要针对大的文本字段

mysql> create index name_idx on account(name);
Query OK, 0 rows affected (0.03 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> show index from account;
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
| Table   | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment | Visible | Expression |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
| account |          0 | PRIMARY  |            1 | id          | A         |           4 |     NULL |   NULL |      | BTREE      |         |               | YES     | NULL       |
| account |          1 | name_idx |            1 | name        | A         |           4 |     NULL |   NULL | YES  | BTREE      |         |               | YES     | NULL       |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
2 rows in set (0.01 sec)

　　　　说明1：这就创建了一个名为name_idx的索引

　　4.3 删除索引

drop index 索引名 on 表名

　　　　示例

mysql> drop index name_idx on account;
Query OK, 0 rows affected (0.00 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> show index from account;
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
| Table   | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment | Visible | Expression |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
| account |          0 | PRIMARY  |            1 | id          | A         |           4 |     NULL |   NULL |      | BTREE      |         |               | YES     | NULL       |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+
1 row in set (0.00 sec)

　　　　说明：这就删除了一个索引

五、预告

　　后面的文章会继续介绍索引的使用和设计原则

posted @ 2023-07-27 23:30 Se7eN_HOU 阅读(811) 评论(0) 收藏举报

刷新页面返回顶部

侯哥的Python分享