MySQL 数据库服务事务知识

数据库存储事务机制概念

事务(Transaction)可以更通俗的理解为交易，所以事务会伴随着交易类的业务类型出现的概念（工作模式）；

现实生活中存在很多的交易行为，比如：物换物的等价交换、货币换物的等价交换、虚拟货币换物(虚拟物品)的等价交换；

因此就需要考虑如何保证现实生活中交易过程的和谐，一般会有法律、道德等方面规则进行约束；

而在数据库服务中为了保证线上交易的"和谐"，便加入了"事务"工作机制

数据库存储事务机制特性

在数据库服务中引入事务机制概念，主要是为了应用事务机制的相关特性处理安全一致性问题，其中事务机制主要包含的特性有：

特性一：原子性（Atomicity）

原子性表示一个事务生命周期中的DML语句，要么全成功要么全失败，不可以出现中间状态；

语句要么全执行，要么全不执行，是事务最核心的特性，事务本身就是以原子性来定义的；实现主要基于undo log

Begin：DML01 DML02 DML03 Commit;

特性二：一致性（Consistency）

一致性表示一个事务发生前、中、后，数据都最终保持一致，即读和写都要保证一致性；

事务追求的最终目标，一致性的实现既需要数据库层面的保障，也需要应用层面的保障；

CR + Double write

特性三：隔离性（Isolation）

隔离性表示一个事务操作数据行的时候，不会受到其他事务的影响，主要利用锁机制来保证隔离性；

特性四：持久性（Durability）

持久性表示一旦事务进行了提交，即可永久生效（落盘）

保证事务提交后不会因为宕机等原因导致数据丢失；实现主要基于redo log

事务ACID相关知识官方说明：https://dev.mysql.com/doc/refman/8.0/en/mysql-acid.html

数据库存储事务生命周期

在运用事务机制完成相关工作任务时，对于事务使用是存在生命周期概念的，标准显示的事务生命周期控制语句有：

-- 开启事务机制
begin;
start transaction;

-- 提交事务任务
commit;

-- 回滚事务操作
rollback;

说明：事务生命周期中，只能使用DML语句，其中包括：select、update、delete、insert；DDL语句会隐式进行提交

事务的生命周期操作演示：

# 进行测试数据库查询数据
mysql> use world;
mysql> select * from city limit 10;

# 进行测试数据库数据撤销修改
mysql> begin;
mysql> update city set population=10 where id=1;
mysql> update city set population=10 where id=2;
-- 由于是采用事务进行的修改，所以只是在内存层面进行的修改，并没有对磁盘上的数据进行修改；
mysql> select * from city limit 10;
-- 由于是采用事务进行的修改，此时看到的数据信息只是内存层面的修改信息
mysql> rollback;
-- 由于是采用事务进行的撤销，会读取undo文件信息，将事务操作撤回到事务开始前的状态
mysql> select * from city limit 10;
-- 由于是采用事务进行的修改，当撤销操作执行完，看到数据信息还是原来的；

# 进行测试数据库数据永久修改
mysql> begin;
mysql> update city set population=10 where id=1;
mysql> update city set population=10 where id=2;
-- 由于是采用事务进行的修改，所以只是在内存层面进行的修改，并没有对磁盘上的数据进行修改；
mysql> select * from city limit 10;
-- 由于是采用事务进行的修改，此时看到的数据信息只是内存层面的修改信息
mysql> commit;
-- 由于是采用事务进行的提交，会加载redo文件信息，将事务内存层面的修改同步到磁盘中（完成了D特性）
mysql> select * from city limit 10;
-- 由于是采用事务进行的修改，当执行操作执行完，看到数据信息将永久保存下载；

数据库存储事务提交方式

方式一：在事务生命周期管理过程中，事务的提交机制可以采用自动提交方式（auto_commit）

事务自动提交方式作用说明：

事务自动提交表示在没有显示的使用begin语句的时候，执行DML操作语句时，会在DML操作语句前自动添加begin；

并在DML操作语句执行后自动添加commit；

在生产环境中，若处于频繁事务业务场景中，建议关闭autocommit自动提交功能，或者每次事务执行的时候；

都进行显示的执行begin和commit

事务自动提交方式参数信息：

mysql> select @@autocommit;
+---------------------+
| @@autocommit |
+---------------------+
|                          1 |
+---------------------+
1 row in set (0.00 sec)
-- 在事务自动提交功能设置修改时，设置为1表示开启自动提交，设置为0表示关闭自动提交

事务自动提交方式参数修改：

# 临时关闭事务自动提交功能
mysql> set global autocommit=0;
-- 配置调整后，重新登录mysql数据库生效

# 永久关闭事务自动提交功能
[root@xiaoQ-01 ~]# vim /etc/my.cnf
[mysqld]
autocommit=0
-- 配置调整后，重新启动mysql数据库生效

事务自动提交方式设置方式优点缺点说明：

序号	参数配置	优劣势
情况1	autocommit=0 关闭事务自动提交	优势：可以编写多个关联的DML，进行一次性提交操作，若出现异常可以回滚符合原子特性
		劣势：可能出现多个关联的DML，只是完成了部分操作，这时就可能等待状态基于隔离特性，操作的数据表或数据行就会进入锁定状态
情况2	autocommit=1 开启事务自动提交	优势：可以出现多个关联的DML，逐行操作自动提交，就可以不用处于锁等待状态
		劣势：可能出现多个关联的DML，，每执行一条就进行提交，会造成多个语句执行不符合原子性

方式二：在事务生命周期管理过程中，事务的提交机制可以采用隐式提交方式：

在进行事务操作时，需要注意操作语句必须都是DML语句，如果中间插入了DDL语句，也会造成之前的事务操作自动提交；

begin; DML1; DML2; DDL1; COMMIT; DML3; COMMIT;
-- 这种情况出现会破坏原本事务的原子性

隐式自动提交方式语句：

在出现隐式自动提交时，可能导致提交的非事务语句有：

序号	语句类型	涉及命令
01	DDL语句类型	alter、create、drop
02	DCL语句类型	grant、revoke、set password
03	锁定语句类型	lock tables、unlock tables
04	其他语句类型	truncate table、load data infile、select for update

说明：在多个数据库会话窗口中，A窗口的所有事务性DML操作，不会受到B窗口的非事务语句影响，同一会话窗口会有影响；

隐式自动回滚情况分析：

情况一：在事务操作过程中，会话窗口自动关闭了，会进行隐式自动回滚；
情况二：在事务操作过程中，数据库服务被停止了，会进行隐式自动回滚；
情况三：在事务操作过程中，出现事务冲突死锁了，会进行隐式自动回滚；

数据库存储事务隔离级别

数据库事务隔离级别主要作用是实现事务工作期间，数据库操作读的隔离特性，所谓读的操作就是将数据页可以调取到内存；

然后可以读取数据页中相应数据行的能力，并且不同事务之间的数据页读操作相互隔离；

可以简单理解为：一个事务在对数据页中数据行做更新操作时，在没有更新提交前，另一个事务此时是不能读取数据页中数据行内容的；

对于数据库存储事务隔离级别包括4种，可以通过操作命令查看获取当前使用的隔离级别:

mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation  |
+---------------------------------+
| REPEATABLE-READ              |
+---------------------------------+
1 row in set (0.00 sec)

常用的事务隔离级别类型：

类型一：RU（READ-UNCOMMITTED 表示读未提交）

可以读取到事务未提交的数据，隔离性差，会出现脏读（当前内存读），不可重复读，幻读问题;

类型二：RC（READ-COMMITTED 表示读已提交）可用

可以读取到事务已提交的数据，隔离性一般，不会出现脏读问题，但是会出现不可重复读，幻读问题；

类型三：RR（REPEATABLE-READ 表示可重复读）默认

可以防止脏读（当前内存读），防止不可重复读问题，防止会出现的幻读问题，但是并发能力较差；

会使用next lock锁进制，来防止幻读问题，但是引入锁进制后，锁的代价会比较高，比较耗费CPU资源，占用系统性能；

类型四：SR（SERIALIZABLE 可串行化）

隔离性比较高，可以实现串行化读取数据，但是事务的并发度就没有了；

这是事务的最高级别，在每条读的数据上，加上锁，使之不可能相互冲突

事务隔离级别官方链接：https://dev.mysql.com/doc/refman/8.0/en/innodb-transaction-isolation-levels.html

常用的事务隔离级别名词：

在解释分析说明相应的隔离级别名词前，需要对数据库事务隔离级别进行调整，以及关闭自动提交功能：

# 设置事务隔离级别
mysql> set global transaction_isolation='READ-UNCOMMITTED';
mysql> set global transaction_isolation='READ-COMMITTED';
mysql> set global transaction_isolation='REPEATABLE-READ';

# 查看事务隔离级别
mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation |
+---------------------------------+
| READ-UNCOMMITTED         |
+---------------------------------+
mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation  |
+---------------------------------+
| READ-COMMITTED               |
+---------------------------------+
mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation |
+---------------------------------+
| REPEATABLE-READ             |
+---------------------------------+

# 临时关闭自动提交功能：
mysql> set global autocommit=0;
mysql> select @@autocommit;
+---------------------+
| @@autocommit |
+---------------------+
|                          0 |
+---------------------+

创建隔离级别测试数据表：

mysql> use mydb
mysql> create table t1 (
    id int not null primary key auto_increment,
    a int not null,
    b varchar(20) not null,
    c varchar(20) not null
) charset=utf8mb4 engine=innodb;

mysql> begin;
mysql> insert into t1(a,b,c)
values
(5,'a','aa'),
(7,'c','ab'),
(10,'d','ae'),
(13,'g','ag'),
(14,'h','at'),
(16,'i','au'),
(20,'j','av'),
(22,'k','aw'),
(25,'l','ax'),
(27,'o','ay'),
(31,'p','az'),
(50,'x','aze'),
(60,'y','azb');
mysql> commit;
-- 确认两个SQL会话窗口，即不同的事务查看的数据是否一致的；

名词解读分析一：脏读

脏读主要表示在一个事务窗口中，没有数据修改提交操作前，另一个事务就可以看到内存中数据页的修改；

简单理解：在一个事务窗口中，可以读取到别人没有提交的数据信息；

利用隔离级别RU解读：

# 设置事务隔离级别
mysql> set global transaction_isolation='READ-UNCOMMITTED';
mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation |
+---------------------------------+
| READ-UNCOMMITTED         |
+---------------------------------+
mysql> set global autocommit=0;
mysql> select @@autocommit;
-- 重新开启两个SQL会话窗口

# 数据库A会话窗口操作
mysql> begin;
mysql> update t1 set a=10 where id=1;
-- 只是在内存层面进行数据页中数据修改
mysql> rollback;
-- 进行事务回滚操作

# 数据库B会话窗口操作
mysql> begin;
mysql> select * from t1 where id=1;
+----+----+---+----+
| id   | a   | b  | c   |
+----+----+---+----+
|  1   | 10 | a  | aa |
+----+----+---+----+
1 row in set (0.01 sec)
-- 在A会话窗口没提交的事务修改，被B会话窗口查询到了
mysql> select * from t1 where id=1;
+----+----+---+----+
| id   | a   | b  | c   |
+----+----+---+----+
|  1   | 5   | a  | aa |
+----+----+---+----+
1 row in set (0.01 sec)
-- 在A会话窗口进行回滚后，在B窗口查询的数据又恢复了

名词解读分析二：不可重复读

不可重复读表示在一个事务中，利用相同的语句多次查询，获取的数据信息是不同的；

利用隔离级别RU解读：

# 数据库B会话窗口操作
mysql> begin;
mysql> select * from t1 where id=1;
+----+----+---+----+
| id   | a   | b  | c   |
+----+----+---+----+
|  1   | 10 | a  | aa |
+----+----+---+----+
1 row in set (0.01 sec)
-- 在B会话事务窗口进行数据第一次查询看到数据信息：a=10
mysql> select * from t1 where id=1;
+----+----+---+----+
| id   | a   | b  | c   |
+----+----+---+----+
|  1   | 5   | a  | aa |
+----+----+---+----+
1 row in set (0.01 sec)
-- 在B会话事务窗口进行数据第二次查询看到数据信息：a=5

利用隔离级别RC解读：

# 设置事务隔离级别
mysql> set global transaction_isolation='READ-COMMITTED';
mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation |
+---------------------------------+
| READ-COMMITTED              |
+---------------------------------+
mysql> set global autocommit=0;
mysql> select @@autocommit;
-- 重新开启两个SQL会话窗口

# 数据库A会话窗口操作
mysql> use mydb;
mysql> begin;
mysql> select * from t1 where id=1;
+----+---+---+----+
| id   | a  | b  | c  |
+----+---+---+----+
|  1   | 5  | a  | aa |
+----+---+---+----+
1 row in set (0.00 sec)
-- A窗口事务查询信息 = B窗口事务查询信息
mysql> update t1 set a=10 where id=1;
-- A窗口事务进行修改
mysql> commit;
-- A窗口事务进行提交

# 数据库B会话窗口操作
mysql> use mydb;
mysql> begin;
mysql> select * from t1 where id=1;
+----+---+---+----+
| id   | a  | b  | c  |
+----+---+---+----+
|  1   | 5  | a  | aa |
+----+---+---+----+
1 row in set (0.00 sec)
-- A窗口事务查询信息 = B窗口事务查询信息
mysql> select * from t1 where id=1;
+----+---+---+----+
| id   | a  | b  | c  |
+----+---+---+----+
|  1   | 5  | a  | aa |
+----+---+---+----+
1 row in set (0.00 sec)
-- B窗口事务查询信息，不能看到A窗口事务未提交的数据变化，避免了脏数据问题；
mysql> select * from t1 where id=1;
+----+---+---+----+
| id   | a  | b  | c  |
+----+---+---+----+
|  1   | 10 | a  | aa |
+----+---+---+----+
1 row in set (0.00 sec)
-- A窗口事务提交之后，B窗口事务查询信息和之前不同了

利用隔离级别RR解读：

# 设置事务隔离级别
mysql> set global transaction_isolation='REPEATABLE-READ';
mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation |
+---------------------------------+
| REPEATABLE-READ              |
+---------------------------------+
mysql> set global autocommit=0;
mysql> select @@autocommit;
-- 重新开启两个SQL会话窗口

# 数据库A会话窗口操作
mysql> use mydb;
mysql> begin;
mysql> select * from t1;
-- 确认初始数据信息
mysql> update t1 set a=10 where id=1;
-- A窗口事务进行修改
mysql> commit;
-- A窗口事务进行提交

# 数据库B会话窗口操作
mysql> use mydb;
mysql> begin;
mysql> select * from t1;
-- 确认初始数据信息
mysql> select * from t1 where id=1;
+----+---+---+----+
| id   | a  | b  | c  |
+----+---+---+----+
|  1   | 5  | a  | aa |
+----+---+---+----+
1 row in set (0.00 sec)
-- B窗口事务查询信息，不能看到A窗口事务未提交的数据变化，避免了脏数据问题；
mysql> select * from t1 where id=1;
+----+---+---+----+
| id   | a  | b  | c  |
+----+---+---+----+
|  1   | 5  | a  | aa |
+----+---+---+----+
1 row in set (0.00 sec)
-- A窗口事务提交之后，B窗口事务查询信息和之前是相同的；
-- 在RR级别状态下，同一窗口的事务生命周期下，每次读取相同数据信息是一样，避免了不可重复读问题
mysql> commit;
mysql> select * from t1 where id=1;
-- 在RR级别状态下，同一窗口的事务生命周期结束后，看到的数据信息就是修改的了

名词解读分析三：幻读

利用隔离级别RC解读：

# 设置事务隔离级别
mysql> set global transaction_isolation='READ-COMMITTED';
mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation |
+---------------------------------+
| READ-COMMITTED              |
+---------------------------------+
mysql> set global autocommit=0;
mysql> select @@autocommit;
-- 重新开启两个SQL会话窗口

# 数据库A会话窗口操作（重新进入）
mysql> use mydb;
mysql> select * from t1;
+----+----+---+-----+
| id | a  | b | c   |
+----+----+---+-----+
|  1 | 10 | a | aa  |
|  2 |  7 | c | ab  |
|  3 | 10 | d | ae  |
|  4 | 13 | g | ag  |
|  5 | 14 | h | at  |
|  6 | 16 | i | au  |
|  7 | 20 | j | av  |
|  8 | 22 | k | aw  |
|  9 | 25 | l | ax  |
| 10 | 27 | o | ay  |
| 11 | 31 | p | az  |
| 12 | 50 | x | aze |
| 13 | 60 | y | azb |
+----+----+---+-----+
13 rows in set (0.00 sec)
-- 查看获取A窗口表中数据
mysql> alter table t1 add index idx(a);
-- 在A窗口中，添加t1表的a列为索引信息
mysql> begin;
-- 在A窗口和B窗口中，同时做开始事务操作；
mysql> update t1 set a=20 where a<20;
-- 在A窗口中，将a<20的信息均调整为20
mysql> commit;
-- 在A窗口中，进行事务提交操作，是在B窗口事务没有提交前
mysql> mysql> select * from t1;
-- 在A窗口中，查看数据信息，希望看到的a是没有小于20的，但是结果看到了a存在等于10的（即出现了幻读）

# 数据库B会话窗口操作（重新进入）
mysql> use mydb;
mysql> select * from t1;
+----+----+---+-----+
| id | a  | b | c   |
+----+----+---+-----+
|  1 | 10 | a | aa  |
|  2 |  7 | c | ab  |
|  3 | 10 | d | ae  |
|  4 | 13 | g | ag  |
|  5 | 14 | h | at  |
|  6 | 16 | i | au  |
|  7 | 20 | j | av  |
|  8 | 22 | k | aw  |
|  9 | 25 | l | ax  |
| 10 | 27 | o | ay  |
| 11 | 31 | p | az  |
| 12 | 50 | x | aze |
| 13 | 60 | y | azb |
+----+----+---+-----+
13 rows in set (0.00 sec)
-- 查看获取B窗口表中数据
mysql> begin;
mysql> insert into t1(a,b,c) values(10,'A','B')
-- 在B窗口中，插入一条新的数据信息 a=10 
mysql> commit;
-- 在B窗口中，进行事务提交操作

利用隔离级别RR解读：

# 设置事务隔离级别
mysql> set global transaction_isolation='REPEATABLE-READ';
mysql> select @@transaction_isolation;
+---------------------------------+
| @@transaction_isolation |
+---------------------------------+
| REPEATABLE-READ              |
+---------------------------------+
mysql> set global autocommit=0;
mysql> select @@autocommit;
-- 重新开启两个SQL会话窗口

# 数据库A会话窗口操作
mysql> use mydb;
mysql> select * from t1;
-- 查看获取A窗口表中数据
mysql> alter table t1 add index idx(a);
-- 在A窗口中，添加t1表的a列为索引信息
mysql> begin;
mysql> update t1 set a=20 where a>20;
-- 在A窗口中，将a>20的信息均调整为20

# 数据库B会话窗口操作
mysql> use mydb;
mysql> select * from t1;
-- 查看获取B窗口表中数据
mysql> begin;
mysql> insert into t1(a,b,c) values(30,'sss','bbb');
-- 在B窗口中，插入一条新的数据信息 a=30，但是语句执行时会被阻塞，没有反应；
mysql> show processlist;
-- 在C窗口中，查看数据库连接会话信息，insert语句在执行，等待语句超时（默认超时时间是50s）
-- 因为此时在RR机制下，创建了行级锁(阻塞修改)+间隙锁(阻塞区域间信息插入)=next lock
-- 区域间隙锁 < 左闭右开(可用临界值)  ;  区域间隙锁 > 左开右闭（不可用临界值）

事务隔离机制知识点补充：

提到事务肯定不陌生，和数据库打交道的时候，总是会用到事务。

最经典的例子就是转账，你要给朋友小王转 100 块钱，而此时你的银行卡只有 100 块钱。

转账过程具体到程序里会有一系列的操作，比如查询余额、做加减法、更新余额等，这些操作必须保证是一体的；

不然等程序查完之后，还没做减法之前，你这100块钱，完全可以借着这个时间差再查一次，然后再给另外一个朋友转账，

如果银行这么整，不就乱了么？这时就要用到“事务”这个概念了。

简单来说，事务就是要保证一组数据库操作，要么全部成功，要么全部失败。

在 MySQL 中，事务支持是在引擎层实现的。MySQL 是一个支持多引擎的系统，但并不是所有的引擎都支持事务。

比如 MySQL 原生的 MyISAM 引擎就不支持事务，这也是 MyISAM 被 InnoDB 取代的重要原因之一。

下面将会以 InnoDB 为例，剖析 MySQL 在事务支持方面的特定实现，并基于原理给出相应的实践建议，希望这些案例能加深你对 MySQL 事务原理的理解。

隔离性与隔离级别

提到事务，肯定会想到 ACID（Atomicity、Consistency、Isolation、Durability，即原子性、一致性、隔离性、持久性），

我们就来说说其中 I，也就是“隔离性”。

当数据库上有多个事务同时执行的时候，就可能出现以下问题：

脏读（dirty read）
不可重复读（non-repeatable read）
幻读（phantom read）

为了解决这些问题，就有了“隔离级别”的概念。在谈隔离级别之前，首先要知道，隔离得越严实，效率就会越低。

因此很多时候，都要在二者之间寻找一个平衡点。SQL 标准的事务隔离级别包括：

隔离级别	英文描述	解释说明
读未提交	RU-read uncommitted	一个事务还没提交时，它做的变更就能被别的事务看到。
读提交	RC-read committed	一个事务提交之后，它做的变更才会被其他事务看到。
可重复读	RR-repeatable read	一个事务执行过程中看到的数据，总是跟这个事务在启动时看到的数据是一致的。当然在可重复读隔离级别下，未提交变更对其他事务也是不可见的。
串行化	serializable	顾名思义是对于同一行记录，“写”会加“写锁”，“读”会加“读锁”。当出现读写锁冲突的时候，后访问的事务必须等前一个事务执行完成，才能继续执行。

其中“读提交”和“可重复读”比较难理解，所以我用一个例子说明这几种隔离级别。

假设数据表 T 中只有一列，其中一行的值为 1，下面是按照时间顺序执行两个事务的行为。

mysql> create table T(c int) engine=InnoDB;
mysql> insert into T(c) values(1);

两个事务操作行为：

事务行为顺序	事务A	事务B
01	启动事务；查询得到值1	启动事务
02		查询得到值1
03		将1改为2
04	查询得到值v1
05		提交事务B
06	查询得到值v2
07	提交事务A
08	查询得到值v3

在不同的隔离级别下，事务 A 会有哪些不同的返回结果，也就是图里面 V1、V2、V3 的返回值分别是什么。

若隔离级别是“读未提交”：

则 V1 的值就是 2，事务 B 虽然还没有提交，但是结果已经被 A 看到了。因此，V2、V3 也都是 2。

若隔离级别是“读提交”：

则 V1 是 1，V2 的值是 2，事务 B 的更新在提交后才能被 A 看到。所以， V3 的值也是 2。

若隔离级别是“可重复读”：

则 V1、V2 是 1，V3 是 2，之所以 V2 还是 1，遵循的就是这个要求：事务在执行期间看到的数据前后必须是一致的。

若隔离级别是“串行化”：

则在事务 B 执行“将 1 改成 2”的时候，会被锁住。直到事务 A 提交后，事务 B 才可以继续执行。

所以从 A 的角度看， V1、V2 值是 1，V3 的值是 2。

数据库存储事务工作流程

根据存储事务的工作流程原理，来了解如何保证事务的ACID特性，利用了MySQL数据库的哪些工作机制；

事务工作流程名字解释：

名词解释一：redo log-Disk

表示重做日志，当出现异常情况，内存中数据直接写入磁盘失败时，可以通过重启数据库服务，读取此文件修复数据信息；

文件存储表项为：ib_logfile0~N 默认48M，轮询使用

名词解释二：redo log buffer-mem

表示重做日志生成缓冲区，相当于redo log的内存区域。redo log文件与redo log buffer是有IO关系的；

事务修改提交后：redo log buffer -> redo log，表示写入数据到redo log；

事务操作恢复时：redo log -> redo log buffer，表示读取数据从redo log；

名词解释三：tablespace file-disk

表示存储表数据行和索引等信息的文件，含有表空间所有数据文件；ibd

名词解释四：Innodb buffer pool-mem

表示数据缓冲区，主要用于缓冲事务要处理的数据和索引信息，tablespace文件与buffer pool是有IO关系的；

名词解释五：LSN

表示日志序列号，在buffer pool中有数据页信息的变化就会记录到redo log buffer中，主要记录变化了多少字节量；

利用LSN记录相应数据页的变化量(LSN+变化字节量)，也可以理解为记录的是日志量的变化；

MySQL每次数据库启动，都会比较磁盘数据页和redolog的LSN，必须要求两者一致，数据库才能正常启动；

名词解释六：WAL（Write Ahead Log）

表示redo日志生成记录优先于数据页写入到磁盘的过程，并且是支持预写入机制（group commit）的；

名词解释七：Dirty page

表示在内存进行修改的数据页，在redo buffer中会记录数据页的数据量的变化，此时在数据页还未最终写入到磁盘中时；

就称之为脏页，所以一般所谓的脏读就是读取脏页的数据页信息；

名词解释八：CheckPoint

表示为检查点，就是将脏页刷写到磁盘的动作；

名词解释九：DB_TRX_ID（6字节）

表示为事务ID号，InnoDB会为每一个事务生成一个事务号（由事务管理器管理TM），伴随着整个事务生命周期

其中事务ID号码信息，在redo和undo日志文件中都会有相应的标识；

名词解释十：DB_ROLL_PTR（7字节）

表示回滚指针，在rollback时会使用undo日志回滚已修改的数据，DB_ROLL_PTR会指向此次事务的回滚业务点；

从而找到undo上的相应的日志信息；

数据库名词解释官方参考：https://dev.mysql.com/doc/refman/8.0/en/glossary.html

事务工作流程具体解读：

简单事务情况举例：

mysql> begin;
mysql> update t1 set A=2 where A=1;
mysql> commit;

事务工作流程一：redo log 重做日志如何应用

用户发起update操作事务语句，将磁盘数据页（page100，A=1，LSN=1000）加载到内存（buffer_pool）缓冲区；
将在内存中发生数据页修改操作（A=1改为A=2），形成数据页脏页，更改中数据页的变化会记录到redo buffer中；

加入1000个字节日志信息，LSN=1000+1000=2000;
当执行事务提交操作的时候，基于WAL机制，等到redo buffer中的日志完全落盘到ib_logfileN-redo log中，即commit正式完成；
此时ib_logfileN中记录了一条日志，内容为：page100数据页变化+LSN=2000

简单理解：记录内存数据页变化日志+undo（DB_TRX_ID，DB_ROLL_PTR），通过LSN和数据页建立关系

特殊情景分析：当此时，redo落盘了，数据页没有落盘，出现宕机情况了；

MySQL CR（自动故障恢复）工作模式，启动数据库时，自动检查redo的LSN和数据页LSN；
如果发现redo LSN > 数据页的LSN，加载原始数据页+变化redo指定内存，使用redo重构脏页（前滚）；
如果确认此次事务已经提交（commit标签），立即触发CKPT（checkpoint）动作，将脏页刷写到磁盘上；

知识点补充：

MySQL有一种机制，批量刷写redo的机制：会在A事务commit时，顺便将redo buffer中的未提交的redo日志也一并刷到磁盘；

为了区分不同状态的redo，日志记录时会标记是否commit；

redo保证了ACID哪些特性：

主要保证了D的特性，另外A C也有间接关联；

Redo Log日志文件生成流程：

1668703457452

Redo Log日志文件应用流程：

1668703613790

说明：利用redo Log重做日志功能可以保证事务的D特性，基于可以丢内存数据，但是不可以丢操作事务日志的原则；

存储引擎读写磁盘数据页IO信息：

mysql> select @@innodb_read_io_threads;
+------------------------------------+
| @@innodb_read_io_threads |
+------------------------------------+
|                                                4 |
+------------------------------------+
1 row in set (0.00 sec)
-- 接收SQL层处理信息传达到存储引擎层的读IO配置信息；

mysql> select @@innodb_write_io_threads;
+------------------------------------+
| @@innodb_write_io_threads |
+------------------------------------+
|                                                 4 |
+------------------------------------+
1 row in set (0.00 sec)
-- 接收SQL层处理信息传导到存储引擎层的写IO配置信息

存储引擎序号号码信息查看：

mysql> show engine innodb status\G
Log sequence number                   105377511
-- redo buffer中的SN号码信息
Log flushed up to                           105377511
-- redo buffer刷新到磁盘上的SN号码信息
Last checkpoint at                         105377511
-- 磁盘数据页的SN号码信息

存储引擎redo buffer落盘的机制策略：****

mysql> select @@innodb_flush_log_at_trx_commit;
+-----------------------------------------------+
| @@innodb_flush_log_at_trx_commit |
+-----------------------------------------------+
|                                                               1 |
+-----------------------------------------------+
1 row in set (0.00 sec)
-- 表示数据库配置与安全有关的两个双一配置
-- 当数值为1：表示每次事务提交就立刻进行redo buffer刷新落盘，若落盘不成功，则commit命令操作也不会成功；默认
-- 当数值为0：表示日志缓存信息写入磁盘是按照每秒种进行一次操作，未刷新日志的事务可能会在崩溃中丢失；不安全
-- 当数值为2：表示在事务提交后先生成日志缓存信息，然后再按照每秒钟进行一次写入磁盘操作；不安全
-- 参考官方链接：https://dev.mysql.com/doc/refman/8.0/en/innodb-parameters.html

事务工作流程二：undo log 回滚日志如何应用

事务发生数据页修改之前，会申请一个undo事务操作，保存了事务回滚日志（逆向操作的逻辑日志）
undo写完之后，事务修改数据页头部（会记录DB_TRX_ID+DB+ROLL_PTR）,这个信息也会被记录在redo Log中

简单理解：记录数据修改的前镜像（逆向操作）,数据页和undo通过DB_TRX_ID，DB_ROLL_PTR建立关系

特殊情景分析01：

当执行rollback命令时，根据数据页的DB_TRX_ID+DB+ROLL_PTR信息，找到undo日志并进行回滚；

特殊情景分析02：

mysql> begin;
mysql> update t1 set A=2 where A=1;
-- 此时宕机了

假设：undo 有；redo 没有

启动数据库时，检查redo和数据页的LSN号码，发现是一致的；
所以不需要进行redo的前滚，此时也不需要回滚。undo信息直接被标记为可覆盖状态；

假设：undo 有；redo 也有（没有commit标签）

MySQL CR（自动故障恢复）工作模式，启动数据库时，自动检查redo的LSN和数据页LSN;
如果发现redo LSN>数据页的LSN。随即加载原始数据页+变化redo Log日志信息到相应内存位置，使用redo重构脏页（前滚）；
如果确认此次事务没有commit标记，立即触发回滚操作，根据DB_TRX_ID+DB_ROLL_PTR信息，找到undo回滚日志，实现回滚；

以上流程被称之为InnoDB的核心特性：自动故障恢复（CR），会先前滚再回滚，先应用redo再应用undo；

undo保证了ACID哪些特性：

主要保证事务的A的特性，同时C和I的特性也有关系；

undo Log日志文件生成流程：

1668741592412

undo Log日志文件应用流程：

1668741660424

说明：利用undo Log重做日志功能可以保证事务的A特性，基于先进行数据页前滚操作恢复脏页，在进行回滚操作恢复操作前事务；

事务工作流程三：事务中的C特性如何保证

InnoDB crash recovery：数据库意外宕机时刻，通过redo前滚+undo回滚保证数据的最终一致；

InnoDB doubewrite buffer：默认存储在ibdataN中，解决数据页写入不完整；DWB一共2M，分两次。每次1M写入；

redo日志只能恢复好的数据页的内容，但是不能恢复已经有异常的数据页内容；

可以参考官方资料：https://dev.mysql.com/doc/refman/8.0/en/mysql-acid.html

DWB文件信息生成流程：

1668751315005

DWB文件信息应用流程：

1668751396397

事务工作流程四：事务中的I特性如何保证

主要对数据库服务并发访问资源的保护，在并发事务工作期间，防止事务与事务之间的资源争抢（相互影响）；

保证读隔离性

方式一：利用隔离级别保证

序号	隔离级别	简单回顾
01	RU	有可能会出现脏读、不可重复读、幻读
02	RC	有可能会出现不可重复读，幻读
03	RR	有可能会出现幻读（99.9%的读异常问题配合锁机制都可以处理）
04	SR(SE)	采用事务串行工作机制

方式二：利用MVCC机制隔离（只能保证读的隔离）

MVCC(multi-version-concurrent-control)即多版本并发控制，是一种并发控制的方法；

可以类别成Git进行并发处理的机制，其实就是每个事务在发生更新的过程中，维护发生更新事务的各个版本；

各个事务版本通过undo的日志（前镜像）实现快照的技术（read view），从而可以保存多个事务版本；

对于隔离级别而言，只有RC和RR级别可以使用到MVCC机制的，实现一种快照读机制，而RU和SR级别是不会使用到MVCC机制的；

RC：应用MVCC的快照读机制，是基于语句级别的；（不可重复读 ture）

在事务期间，执行每个查询语句的时候，都会检查MVCC版本（快照列表），获取最新的已提交事务的快照；

RR：应用MVCC的快照读机制，是基于事务级别的；（不可重复读 false）

在事务期间，执行首条查询语句的时候，就会生成MVCC版本（相应快照），将会一直读取此快照数据信息，直到事务生命周期结束；

以上的RR隔离级别利用MVCC的快照读机制，又称为一致性快照读；

==================================================================================================

MVCC进行多版本控制时，会应用的两种锁机制：乐观锁/悲观锁

每个事务操作都要经历两个阶段：

读阶段--应用乐观锁：

MVCC利用乐观锁机制，实现非锁定读取，借助快照技术（read view）

# 进行操作事务处理过程（trx1）
> begin;
> DML01 语句
-- 在做第一次事务操作的时候，当前事务获取系统最新的 rv1 版本快照
> DML02 语句
-- 在做下一次事务操作的时候，生成新的事务系统查询的 rv2 版本快照
> select 
-- 此时查询的是 rv2快照数据信息
> commit
-- rv2 快照数据被提交，成为系统最新的快照

RC隔离级别快照应用：

trx-01：rv1  -> rv2  -> commit;
trx-02：rv1  -> rv1  -> rv2

RR隔离级别快照应用：

trx-01：第一个查询时，生成global consitence snapshot RV-CS1（10:00），一直伴随着事务生命周期结束
trx-02：第一个查询时，生成global consitence snapshot RV-CS2（10:01），一直伴随着事务生命周期结束

写阶段--应用悲观锁：

即对于写操作，是不能进行并发操作的；

MVCC技术总结：

01 mvcc采用乐观锁机制，实现非锁定读取；

02 在RC级别下，事务中可以立即读取到其它事务提交过的readview数据快照信息；

03 在RR级别下，事务中从第一次查询开始，生成一个一致性readview，直到事务结束

==================================================================================================

保证写隔离性

方式一：利用隔离级别保证

在应用不同隔离级别时也会有不同的锁机制

RC：具有记录锁机制；
RR：具有间隙锁机制+下一键锁机制（next lock）表锁

方式二：利用锁进制隔离（保护并发访问资源）

类型	锁机制	简述说明
内存资源锁	latch（闩锁）	主要是保护内存资源；rwlock（读写锁）、mutex（只读锁）避免不同程序争用相同地址区域内存资源）
元数据锁	MDL	主要是保护元数据资源，限制DDL操作；metadata lock
表级别锁	table_lock	主要是保护整个数据表资源；
	命令方式锁表	lock table t1 read；
	工具方式锁表	利用mysqldump、XBK(PBK)进行备份非InnoDB数据时，将触发FTWRL全局锁表；
	行锁升级为表锁	比如做数据更新操作时，没有设置索引条件信息，就会出现全表扫描，出现表锁；
行级别锁	row_lock	InnoDB默认锁粒度，加锁方式都是在索引上加锁的；
	record lock	记录锁，在聚簇索引锁定，在RC级别只有record lock
	gap lock	间隙锁，在辅助索引间隙加锁，在RR级别存在，防止幻读；
	next look	下一键锁，即GAP+Record，在RR级别存在，防止幻读；

从功能应用方面进行锁分类：了解

IS：表示意向读锁或查询锁，可以在表上进行加锁做提示（select * from t1 lock in shared mode）;
S：表示读锁或查询锁，现在基本上没有自动设置了，除非手工进行设置锁定（lock table t1 read);
IX：表示意向写锁或排他锁，可以在表上进行加锁做提示（select * from t1 for update）
X：表示写锁或排他锁，限制其他人的指定操作行为；

官方参考资料链接：https://dev.mysql.com/doc/refman/8.0/en/innodb-locking.html

posted @ 2025-10-29 09:36 讲文张字阅读(184) 评论(0) 收藏举报

刷新页面返回顶部