Loading

Mysql事务原理与优化

Mysql事务原理与优化

解决多事物并发问题-->事务隔离机制、锁机制、MVCC多版本并发控制隔离机制、日志机制

事务及其ACID属性

事务是一组操作要么全部成功,要么全部失败,目的是为了保证数据最终的一致性

  1. 原子性:当前事务的操作要么同时成功,要么同时失败。原子性由undo log日志来实现。
  2. 一致性 :使用事务的最终目的,由其它3个特性以及业务代码正确逻辑来实现。
  3. 隔离性 :在事务并发执行时,他们内部的操作不能互相干扰。隔离性由MySQL的各种锁以及MVCC机制来实现。
  4. 持久性 :一旦提交了事务,它对数据库的改变就应该是永久性的。持久性由redo log日志来实现。

原子性、隔离性、持久性 ==》 一致性

并发事务处理带来的问题

更新丢失(Lost Update)或脏写
当两个或多个事务选择同一行数据修改,有可能发生更新丢失问题,即最后的更新覆盖
了由其他事务所做的更新。

脏读(Dirty Reads)
事务A读取到了事务B已经修改但尚未提交的数据

不可重读(Non-Repeatable Reads)
事务A内部的相同查询语句在不同时刻读出的结果不一致

幻读(Phantom Reads)
事务A读取到了事务B提交的新增数据

事务隔离级别

“脏读”、“不可重复读”和“幻读”,其实都是数据库读一致性问题,必须由数据库提供一定的事务隔离机制来解决。

隔离级别 脏读(Dirty Read) 不可重复读(NonRepeatable Read) 幻读(Phantom Read)
读未提交(Read uncommitted) 可能 可能 可能
读已提交(Read committed) 不可能 可能 可能
可重复读(Repeatable read) 不可能 不可能 可能
可串行化(Serializable) 不可能 不可能 不可能

数据库的事务隔离越严格,并发副作用越小,但付出的代价也就越大,因为事务隔离实质上就是使事务在一定程度上“串行化”进行,这显然与“并发”是矛盾的。
同时,不同的应用对读一致性和事务隔离程度的要求也是不同的,比如许多应用对“不可重复读"和“幻读”并不敏感,可能更关心数据并发访问的能力。

查看当前数据库的事务隔离级别: show variables like 'tx_isolation';
设置事务隔离级别:set tx_isolation='REPEATABLE-READ';

Mysql默认的事务隔离级别是可重复读,用Spring开发程序时,如果不设置隔离级别默认用Mysql设置的隔离级别,如果Spring设置了就用已经设置的隔离级别

事务隔离级别案例分析

CREATE TABLE `account` (
	`id` int(11) NOT NULL AUTO_INCREMENT,
	`name` varchar(255) DEFAULT NULL,
	`balance` int(11) DEFAULT NULL,
	PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `test`.`account` (`name`, `balance`) VALUES ('lilei', '450');
INSERT INTO `test`.`account` (`name`, `balance`) VALUES ('hanmei', '16000');
INSERT INTO `test`.`account` (`name`, `balance`) VALUES ('lucy', '2400');

读未提交

B事务的更新还未提交,A事务已经读取到B的更新了。属于脏读

graph TD A1[事务A:设置隔离级为read-uncommitted<br>set tx_isolation='read-uncommitted'] --> A2[事务A:查询account初始值(如id=1余额400)] A2 --> B1[事务B:更新account(如id=1余额改为450)<br>事务未提交] B1 --> A3[事务A:查询到B未提交的更新(余额450)<br>→ 产生脏数据] A3 --> B2[事务B:事务回滚(更新被撤销)] B2 --> A4[事务A:执行update id=1余额-50<br>实际用回滚后的值400计算,结果350<br>→ 暴露脏读导致的数据一致性问题] style A3 fill:#FFE6E6,stroke:#FF4444,stroke-width:1px style A4 fill:#FFF3E0,stroke:#FF9800,stroke-width:1px

读已提交

事务B的更新提交之后,事务A就立刻可以查询到。但是产生了不可重复读问题,在同一事务的不同时间段查询到的值不一样

graph TD A1[事务A:设置隔离级为read-committed<br>set tx_isolation='read-committed'] --> A2[事务A:查询account所有记录(如id=1余额400)] A2 --> B1[事务B:更新account(id=1改为450)<br>事务未提交] B1 --> A3[事务A:再次查询<br>→ 读不到B未提交的更新(仍显示400)<br>解决脏读问题] A3 --> B2[事务B:事务提交] B2 --> A4[事务A:第三次查询<br>→ 读到B提交的更新(显示450)<br>→ 产生不可重复读问题] style A3 fill:#E8F5E9,stroke:#4CAF50,stroke-width:1px style A4 fill:#FFF3E0,stroke:#FF9800,stroke-width:1px

可重复读

事务B不管更新多少次,事务A读取到的值,一直都是事务A刚开始的版本。

此时事务A是快照读,但是在事务A中的更新操作是当前读

graph TD A1[事务A:设置隔离级为repeatable-read<br>set tx_isolation='repeatable-read'] --> A2[事务A:查询account(id=1余额400)] A2 --> B1[事务B:更新account(id=1改为350)并提交] B1 --> A3[事务A:再次查询<br>→ 仍显示400(快照读,历史版本)<br>解决不可重复读问题] A3 --> A4[事务A:执行update id=1余额-50<br>→ 用当前版本350计算,结果300(当前读)<br>数据一致性未破坏] A4 --> B2[事务B:插入新数据(如id=4余额500)并提交] B2 --> A5[事务A:查询所有记录<br>→ 读不到新增的id=4(快照读)<br>未出现查询幻读] A5 --> A6[事务A:执行update id=4余额=888<br>→ 更新成功,再次查询能看到id=4<br>→ 幻读在更新时可见] style A3 fill:#E8F5E9,stroke:#4CAF50,stroke-width:1px style A5 fill:#E8F5E9,stroke:#4CAF50,stroke-width:1px

串行化

不同事物之间的读写操作都是串行执行,需要排队

graph TD A1[事务A:设置隔离级为serializable<br>set tx_isolation='serializable'] --> A2[事务A:查询account初始值(如id=1余额400)] A2 --> B1{事务B:更新操作} B1 -->|更新id=1记录| B1a[事务B:操作被阻塞<br>→ 因A查询加行锁] B1 -->|更新id=2记录| B1b[事务B:操作成功<br>→ 不同记录无锁冲突] A2 --> B2[事务A:执行范围查询(如id<5)<br>→ 范围加行锁+间隙锁] B2 --> B3[事务B:在范围内插入新数据(如id=3)<br>→ 操作被阻塞<br>解决幻读问题] B3 --> A3[事务A:事务提交<br>→ 客户端B阻塞解除] style B1a fill:#FFE6E6,stroke:#FF4444,stroke-width:1px style B3 fill:#FFE6E6,stroke:#FF4444,stroke-width:1px style A3 fill:#E8F5E9,stroke:#4CAF50,stroke-width:1px

事务问题定位

查询执行时间超过1秒的事务

SELECT * FROM information_schema.innodb_trx
WHERE TIME_TO_SEC( timediff( now(), trx_started ) ) > 1;

强制结束事务
kill 事务对应的线程id(就是上面语句查出结果里的trx_mysql_thread_id字段的值)

大事务的影响

  1. 并发情况下,数据库连接池容易被撑爆
  2. 锁定太多的数据,造成大量的阻塞和锁超时
  3. 执行时间长,容易造成主从延迟
  4. 回滚所需要的时间比较长
  5. undo log膨胀
  6. 容易导致死锁

事务优化

  1. 将查询等数据准备操作放到事务外
  2. 事务中避免远程调用,远程调用要设置超时,防止事务等待时间太久
  3. 事务中避免一次性处理太多数据,可以拆分成多个事务分次处理
  4. 更新等涉及加锁的操作尽可能放在事务靠后的位置
  5. 能异步处理的尽量异步处理
  6. 应用侧(业务代码)保证数据一致性,非事务执行
posted @ 2025-09-02 21:33  流火无心  阅读(27)  评论(0)    收藏  举报