InnoDB 关键特性

本文参考掘金文章 — 程序员小冰

InnoDB 存储引擎架构（转载）

下图画的太好了，清晰明了，借大佬图镇个场子，后面个人参照此图模仿了下

InnoDB 内存结构（复习）

需要介绍 DoubleWrite ，先单拎出来 InnoDB 内存结构（个人仿制图）

双写 - Double Write

①. 首先，为什么要有双写的功能？

因为要解决 Partial page write — 部分写失效问题

②. 什么是 Partial page write ？

当数据库发生宕机，InnoDB 存储引擎正在写入某个页到表中，而这个页只写了一部分，比如 16KB 的页只写了前 4KB，发生了宕机

此时重启数据库，InnoDB 存储引擎无法找到这个经历了 Partial page write（部分写）的页

因为是 InnoDB 存储引擎是通过 checksum 去寻找页的，发生 Partial page write 问题的页，这种 page 是损坏页，无法找到该 page 的事务号，无法通过 checksum 验证，就无法恢复

③. 双写如何解决 Partical write page ？

InnoDB 在内存中开辟了一块内存区域 Double write buffer，刷脏页时，将缓冲池中的脏页 Copy 到 Double wirte buffer 中，在写数据页之前，先把这个数据页写到一块独立的物理文件位置（ibdata 共享表空间），然后再写到数据文件中

这样在宕机重启时，如果出现数据页损坏，那么在应用 Redo log 之前，需要通过该页在 ibdata 共享表空间中的副本来还原该页，然后再进行 Redo log 重做，这就是 DoubleWrite

DoubleWrite 带给 InnoDB 存储引擎的是数据页的可靠性

④. 每一次脏页的刷新，都要经过双写机制落入磁盘

# 重启数据库后，脏页会刷新到磁盘中，查看双写参数
# innodb_dblwr_pages_written 是从 double wirte buffer 刷入共享表空间 double write 区域的脏页数量 | 此时写入时顺序的
# innodb_dblwr_writes 是从 double wirte buffer 刷入独立表空间 .ibd 数据文件的脏页的数量 | 此时写入是离散的
mysql> show status like "innodb_dblwr%";
+----------------------------+-------+
| Variable_name              | Value |
+----------------------------+-------+
| Innodb_dblwr_pages_written | 2     |
| Innodb_dblwr_writes        | 1     |
+----------------------------+-------+
2 rows in set (0.00 sec)

# 默认情况下所有脏页的刷新，都要经过 double write 
# 查看已经从缓冲池中刷到磁盘的脏页数量（刷入共享表空间 double wirte 中的脏页数量）
mysql> show status like "%pages_flush%";
+----------------------------------+-------+
| Variable_name                    | Value |
+----------------------------------+-------+
| Innodb_buffer_pool_pages_flushed | 36    |
+----------------------------------+-------+
1 row in set (0.00 sec)

# 模拟插入 100 万条记录
mysql> call sp_oneThousand_tbl();
Query OK, 0 rows affected (6 min 41.58 sec)



# 再次观察双写参数
mysql> show status like "innodb_dblwr%";
+----------------------------+-------+
| Variable_name              | Value |
+----------------------------+-------+
| Innodb_dblwr_pages_written | 5734  |    --------------------- 已经顺序写入到磁盘中的共享表空间的脏页
| Innodb_dblwr_writes        | 377   |    --------------------- 已经离散写入到磁盘中的独立表空间的脏页
+----------------------------+-------+
2 rows in set (0.01 sec)

# 刷入磁盘的增长页 5768 - (36 - 2) = 5734 
# 上述等式证明，所有脏页的刷新，都要经过 double write 
mysql> show status like "%pages_flus%";
+----------------------------------+-------+
| Variable_name                    | Value |
+----------------------------------+-------+
| Innodb_buffer_pool_pages_flushed | 5768  |
+----------------------------------+-------+
1 row in set (0.00 sec)

自适应哈希索引 - Adaptive Hash Index

哈希（hash）是一种非常快速的查找方法，时间复杂度是 O(1) ，即一般一次就能定位数据

B+ 树的查找次数，取决于 B+ 树的高度，生产环境中，B+ 树的高度一般是 3-4 层，故需要查找 3-4 次查询。

InnoDB 会监控对表上各个索引页的查询，如果观察到建立 Hash 索引可以带来速度提升，则建立 Hash 索引

即称为自适应 Hash 索引 — Adaptive Hash Index，AHI

AHI 通过缓冲池的 B+ 树构造而来，建立的速度很快，不需要对整张表建立 Hash 索引

InnoDB 自动根据访问的频率和模式为某些热点数据建立 AHI 索引

Ⅰ. AHI 有一个要求

对这个索引页的数据的访问模式（即查询条件），必须是一样的

例如我们创建了一个联合索引（a,b），会有对应的联合索引页

当我们访问到该索引页时，访问模式（查询条件）可以是以下几种

WHERE a=xxx
WHERE a=xxx and b=xxx

如果在我们的 SQL 中，上面两种查询条件都有用到，那么 InnoDB 不会对这个索引页构造 AHI

Ⅱ. AHI 第二个要求

①. 以该模式访问了 100 次

②. 索引页通过该模式访问了 N 次，其中 N = 索引页中的记录数 * 1/16

启用 AHI 后，读写速度可以提高 2 倍，辅助索引的连接操作性能可以提高 5 倍（官网说明）

该特性属于数据库自由化（self-tuning），无需 DBA 对数据库进行认为干预

合并插入（变更）缓冲 - Merge Insert/Change Buffer

Insert Buffer

首先我们创建一个表，表的主键是 id

当执行插入操作时，id 列会自动增长

页中的行记录，会按照 id 顺序存放，不需要随机读取其他页的数据，这样的情况下（聚集索引），插入效率很高

但是，在大部分的应用中，不会只有一个聚集索引，更多情况下，少不了 secondary index - 辅助索引，如下表所示

# 如下表，除了主键聚集索引，还有辅助索引
mysql> create table sec_test (
    -> id int(4) not null primary key auto_increment,
    -> name varchar(20) not null,
    -> age tinyint unsigned not null,
    -> key  idx_name(name));

这时，除了主键聚集索引，还有辅助索引，对于该非聚集索引来讲，叶子节点的插入不是有序的，这时候需要离散的访问非聚集索引页，插入性能变得很低

因此，InnoDB 设计出插入缓冲技术，对于非聚集索引的插入和更新，不是每一次都直接插入索引页，而是先插入到内存，具体做法：

① 索引页在缓存中，直接插入
② 索引页不在缓存中，先将其放入插入缓冲区，再以一定频率和索引页合并

这样将同一个索引页多个插入合并到一个 IO 操作中，提高写性能

这个设计思路和 HBase 中的 LSM 树有相似之处，都是通过先在内存中修改，到达一定量后，再和磁盘中的数据合并，目的都是为了提高写性能。具体可参考《HBase LSM 树》，这又再一次说明，学到最后，技术都是相通的（我不懂 LSM 树）

插入缓冲的启用需要满足一下两个条件

① 索引是辅助索引（secondary index）
② 索引不适合唯一的

如果辅助索引是唯一的，就不能使用该技术，原因很简单，因为如果这样做，整个索引数据被切分为 2 部分（一部分在插入缓存，一部分在磁盘上还未加载到缓存），无法保证唯一性

插入缓冲带来的问题，任何一项技术在带来好处的同时，必然也带来坏处。插入缓冲主要带来如下两个坏处：

① 可能导致数据库宕机后实例恢复时间变长。如果应用程序执行大量的插入和更新操作，且涉及非唯一的聚集索引，一旦出现宕机，这时就有大量内存中的插入缓冲区数据没有合并至索引页中，导致实例恢复时间会很长。
② 在写密集的情况下，插入缓冲会占用过多的缓冲池内存，默认情况下最大可以占用1/2，这在实际应用中会带来一定的问题。

Change Buffer

InnoDB 1.0 后（MySQL 5.5 之后），用 Change Buffer 代替 Insert Buffer，可以将 Change Buffer 看作 Insert Buffer 的升级

可以对 DML 操作都进行缓冲，包括 Insert Delete Update 操作，分别缓冲到 Insert Buffer，Delete Buffer，Update Buffer 中

可以看出，Change Buffer 包含了上面所述的几类 Buffer

和之前一样，Change Buffer 适用对象依然是非唯一的辅助索引

InnoDB 存储引擎提供了参数 innodb_change_buffering 用来开启各种 Buffer 的选项

可选值 inserts、deletes、purges、changes、all、none

inserts => 启用 Insert Buffer
deletes => 启用 Delete Buffer
purges => 启用 Update Buffer
changes => 启用 Insert & Delete Buffer
all => 启用 Insert & Delete & Update Buffer
none => 都不启用

该参数默认是 all

InnoDB 1.2.* 开始，可以通过 innodb_change_buffer_max_size 控制 Change Buffer 最大使用内存量

默认是 25，即最多使用缓冲池 25% 的内存空间，该参数最大有效值是 50%

mysql> show engine innodb status\G
...
-------------------------------------
INSERT BUFFER AND ADAPTIVE HASH INDEX
-------------------------------------
Ibuf: size 1, free list len 0, seg size 2, 8 merges
merged operations:
 insert 0, delete mark 0, delete 0
 # insert 表示 Insert Buffer
 # delete mark 表示 Delete Buffer
 # delete 表示 Update Buffer
discarded operations:
# discarded opertions 表示当 Change Buffer 发生 Merge 时，表已经被删除了，此时无需将记录合并（Merge）到辅助索引中了
 insert 0, delete mark 0, delete 0
Hash table size 69247, node heap has 0 buffer(s)
Hash table size 69247, node heap has 0 buffer(s)
Hash table size 69247, node heap has 0 buffer(s)
Hash table size 69247, node heap has 0 buffer(s)
Hash table size 69247, node heap has 0 buffer(s)
Hash table size 69247, node heap has 0 buffer(s)
Hash table size 69247, node heap has 0 buffer(s)
Hash table size 69247, node heap has 0 buffer(s)
0.00 hash searches/s, 0.00 non-hash searches/s

异步 IO - Asynchronous IO

与异步 IO 相对的是同步 IO，每进行一次 IO，需要等待 IO 结束后，再进行下一次 IO 操作

如果用户发出一条索引扫描的查询，那么可能要扫描多个索引页，即多次 IO 操作，此时，等待每一个页扫描完再进行下一个页的扫描是没有必要的

用户可以发起一个 IO 请求，不必等待该 IO 请求的结果，发起另外的 IO 请求，当全部 IO 请求发送完毕，等待全部 IO 操作的完成，就是异步 IO — Aaynchronous IO

AIO 的另外一个优势，是可以进行 IO 合并（IO Merge），即将多个 IO 操作合并为 1 个 IO 操作，提高 IOPS 性能

书中案例，例如用户要访问的页的 space,page_no 分别为 (8,1) (8,2) (8,3) ，AIO 会判断这三个页是连续的，AIO 会发送一个 IO 请求，从 (8,1) 开始，连续读取 48KB 的页

# 开启内核级别的 AIO 支持，需要操作系统提供支持，
# 因此编译 MySQL 时，需要 libaio 库的支持
mysql> show variables like "%native_aio%";
+-----------------------+-------+
| Variable_name         | Value |
+-----------------------+-------+
| innodb_use_native_aio | ON    |
+-----------------------+-------+
1 row in set (0.00 sec)

刷新邻接页 - Flush Neighbor Page

当刷新一个脏页时，InnoDB 存储引擎会检测该页所在区的（extent）的所有页，如果是脏页，那么一起刷新

通样的，该操作属于 AIO 的一个范畴，AIO 可以将多个 IO 写入操作，合并为一个 IO 写入操作

在传统的机械硬盘时代，打开这个参数能够减少磁盘寻道的开销，显著提升性能

对于 SSD 设备，寻道时间的性能影响很小，关闭该参数，反而能够分散写操作，提高数据库性

# 是否打开刷新邻接页功能
mysql> show variables like "%neighbor%";
+------------------------+-------+
| Variable_name          | Value |
+------------------------+-------+
| innodb_flush_neighbors | 1     |
+------------------------+-------+
1 row in set (0.00 sec)


- 取值范围：0，1，2
- 默认值：5.7 版本为 1 ，8.0 版本为 0

- 设置为 0 时，表示刷脏页时不刷其附近的脏页
- 设置为 1 时，表示刷脏页时连带其附近毗连的脏页一起刷掉
- 设置为 2 时，表示刷脏页时连带其附近区域的脏页一起刷掉。1与2的区别是2刷的区域更大一些

其他

information_schema 是数据字典，并不同实际上的表和数据库。是由 MySQL 在启动后自行产生和维护，无需备份，也无法用 mysqldump 备份

当然你可以用 SELECT ... INTO OUTFILE 'file_name' 把表中的数据写入到文件中

posted @ 2021-04-22 21:42 拨云见日z 阅读(141) 评论(0) 收藏举报

刷新页面返回顶部

拨云见日