MySQL优化(三)：优化数据库对象

二、优化数据库对象

1、优化表的数据类型

应用设计的时候需要考虑字段的长度留有一定的冗余，但不推荐很多字段都留有大量的冗余，这样既浪费磁盘空间，也在应用操作时浪费物理内存。

在MySQL中，可以使用函数PROCEDURE ANALYSE()对表进行分析，给出优化建议。(16, 256)是指不为包含的值多于16或者256字节的ENUM类型提出建议。

Optimal_fieldtype为优化建议，可以通过alter修改字段类型：ALTER TABLE TAB_NAME MODIFY COLUMN Optimal_fieldtype_VALUE;

2、逆规范化

反规划的好处是降低连接操作的需求、降低外码和索引的数目、减少表的数目，带来的问题可能会出现数据的完整性问题，虽然查询加快，但是会降低修改速度。在进行反规范操作之前，要充分考虑数据的存取需求、常用表的大小、一些特殊的计算、数据的物理存储位置。常用的反规范技术如下：

- 增加冗余列：指在多个表中具有相同的列，它常用来查询时避免连接操作。

- 增加派生列：指增加的列来自其他表中的数据，由其他表中的数据经过计算生成，作用是减少连接操作，避免使用集函数。

- 重新组表：指如果许多用户需要查看两个表连接出来的结果数据，则把这两个表重新组成一个表来减少连接而提高性能。

- 分库分表：https://www.cnblogs.com/dukuan/p/9480610.html

3、使用中间表提高统计查询速度

对于数据量较大的表，在其上进行统计查询通常会效率很低，并且还会对线上应用产生负面影响。此种情况下可以使用中间表提高统计查询的效率。

一般步骤：创建表结构和原表结构相同的表，迁移数据需要统计的数据，进行统计。

中间表在统计查询中的优点：

- 中间表复制源表数据，并且与源表相“隔离”，在中间表上做统计查询不会对线上应用产生负面影响。

- 中间表上可以灵活的添加索引或增加临时用的新字段，从而达到提高统计查询效率和辅助统计查询作用。

三、锁问题

1、锁概述

MyISAM和MEMORY存储引擎采用表级锁，BDB存储引擎(MySQL5.1后不直接支持此存储引擎)采用的页面锁，也支持表级锁，InnoDB支持行级锁和表级锁，默认是行级。

- 表级锁：开销小，加锁快，不会出现死锁，锁定粒度大，发生锁冲突的概率最高，并发度最低。

- 行级锁：开销大，加锁慢，会出现死锁，锁定粒度小，发生冲突的概率最低，并发度也最高。

- 页面锁：开销和加锁时间界于表锁和行锁之间，会出现死锁，锁定粒度界于表锁和行锁之间，并发度一般。

表级锁更适合以查询为主，只有少量按索引条件更新数据的应用，如Web应用。而行级锁更适合有大量按索引条件并发更新少量不同数据，同时又有并发查询的应用，如在线事物处理系统。

2、MyISAM表锁

MyISAM只支持表锁。

2.1 查询表级锁争用情况

Table_locks_immediate：产生表级锁定的次数。

如果Table_locks_waited比较高，说明存在着严重的表级锁争用情况。

2.2 MySQL表级锁的锁模式

表级锁分为表共享读锁和表独占写锁。兼容性如下：

对于MyISAM表的读操作，不会阻塞其他用户对同一表的读请求，但会阻塞对同一个表的写请求。对表的写操作，会阻塞同一表的读和写。MyISAM读操作和写操作以及写操作之间是串行的。

2.3 如何加锁表

MyISAM在执行SELECT、UPDATE、DELETE、INSERT前，会自动给涉及的表加锁，无需用户干预。

显式加锁情况：比如同时要查询或者比对两个表中的内容，为防止在查其中一个时另一个有更新或者新数据，此时需要显式的为两个表加锁。

加锁命令：LOCK TABLES tab_name READ LOCAL, tab_name2 READ LOCAL; -- LOCAL表示允许其他用户在MyISAM表尾并发插入记录。使用显式加锁时，必须同时取得所有涉及表的锁，而且加锁后只能访问加锁的这些表，不能访问其他表。并且如果加的是读锁，那么只能执行查询操作。并且加锁时需要对别名也要加锁。

2.4 MyISAM并发插入

MyISAM通过concurrent_insert参数决定是否允许并发插入

- 0：不允许并发插入

- 1：MyISAM表中无空洞，允许读的同时在表末尾插入记录。默认设置

- 2：无论是否有无空洞，都能插入。

可以利用并发插入特性来解决应用中对同一表查询和插入的锁争用。同时定期在系统空闲时整理空间碎片，收回因删除记录而产生的中间空洞。

注意：只能insert不能update和delete。且锁表的session不能获取到新插入到的数据。

2.5 MyISAM的锁调度

同一时刻请求的写锁和读锁，MySQL会优先处理写进程。即使是读请求先到等待队列，写锁也会插入到读锁请求之前，这也是MyISAM表不太适合于有大量更新操作和查询操作应用的原因。

调节MyISAM的调度行为：

- 通过制定启动参数low-priority-updates，使MyISAM引擎默认给予读请求以优先的权利。

- 通过执行命令 SET LOW_PRIORITY_UPDATES = 1，来降低更新请求的优先级。

- 通过制定INSERT、UPDATE、DELETE语句的LOW_PRIORITY属性，降低该语句的优先级。

MySQL也提供了一种折中的办法，即给系统参数max_write_lock_count设置一个合适的值，当一个表的读锁达到这个值后，MySQL就暂时将写请求的优先级降低。

3、InnoDB锁问题

3.1 背景知识

3.1.1 事务及其ACID属性

事务是由一组SQL语句组成的逻辑处理单元，具有以下4个属性，通常简称为事务的ACID属性。

- 原子性：事务是一个原子操作单元，其对数据的修改，要么全部执行，要么全都不执行。

- 一致性：在事务开始和完成时，数据都必须保持一致状态。这意味着所有相关的数据规则都必须应用于事务的修改，以保持数据的完整性；事务结束时，所有的内部数据结构也都必须是正确的。

- 隔离性：数据库系统提供一定的隔离机制，保证事务在不受外部并发操作影响的独立环境执行。

- 持久性：事务完成之后，它对于数据的修改是永久性的，即使出现系统故障也能够保持。

3.1.2 并发事务处理的问题

相对于串行处理来说，并发事务处理能大大增加数据库资源利用率，提供吞吐量，但会引起下列问题：

- 更新丢失：两个或多个事务同时操作同一行，会覆盖其他事务的更新。

- 脏读：当一个事务在对一条记录做修改未完成并提交前，另一个事务来读取同一条记录，这时读取到的数据叫脏读。

- 不可重复读：一个事务在读取某些数据后的某个时间，再次读取，发现读出的数据已经发生了改变或某些记录已经被删除了。

- 幻读：一个事务按相同的查询条件重新读取以前检索过的数据，其他事务插入了满足其条件的新数据。

3.1.3 事务隔离级别

线上业务应完全避免更新丢失，但是避免此情况需要应用程序对要更新的数据加必要的锁来解决。但是关于读一致性，必须由数据库提供一定的事务隔离机制来解决。数据库事务隔离的方式，基本上可分为以下两种：

- 在读取数据之前，对其加锁。

- 使用数据多版本并发控制(MVCC/MCC)，按照请求时间点创建快照。

数据库的事务隔离越严格，并发副作用越小，相应的代价也就越大，因为事务隔离实质是进行"串行化"。

为了解决隔离和并发的矛盾，ISO/ANSI SQL92定义了4个事务隔离级别。应用可以根据自己的业务逻辑要求，选择不同的隔离级别来平衡隔离和并发的矛盾。

3.2 获取InnoDB行锁争用情况

如果Innodb_row_lock_waits和Innodb_row_lock_time_avg的值比较高，则争用比较严重。

此时可以通过查询information_schema数据库中的表来查看锁情况，或者通过设置InnoDB Monitors来观察发生锁冲突的表、数据行等。

- 通过information_schema

SELECT * FROM innodb_locks;

SELECT * FROM innodb_lock_waits;

- 通过InnoDB Monitors

CREATE TABLE innodb_monitor(a INT) ENGINE = INNODB;

然后通过：SHOW ENGINE INNODB STATUS查看

关闭监视器：DROP TABLE innodb_monitor;

3.3 InnoDB行锁模式及加锁方法

InnoDB实现了两种类型的行锁：

- 共享锁：允许另一个事务也获得共享锁，但是阻止其他事务获得相同数据集的排他锁。

- 排他锁：允许获得排他锁的事务更新数据，阻止其他事务取得相同数据集的共享读锁和排他写锁。

事务获取锁的方式：

- 共享锁：SELECT ... WHERE ... LOCK IN SHARE MODE;

- 排他锁：SELECT ... WHERE ... FOR UPDATE;

对于锁定行后需要进行更新操作的应用，用过使用排他锁。

3.4 InnoDB行锁实现方式

InnoDB行锁是通过索引上的索引项加锁来实现的，如果没有索引，InnoDB将通过隐藏的聚簇索引来记录加锁。分为3种情形：

- Record lock：对索引项加锁。

- Gap lock：对索引项之间的“间隙”、第一条记录前的“间隙”或最后一条记录后的“间隙”加锁。

- Next-key lock：前两种的组合，对记录及其前面的间隙加锁。

注意：如果不通过索引条件检索数据，那么InnoDB将对表中的所有记录加锁，等同于表锁，生产环境中需要注意这一特性防止导致大量的锁冲突，从而影响并发性能。

由于MySQL的行锁是针对索引加的锁，不是针对记录加的锁，所以虽然是访问不同行的记录，但是如果使用相同的索引建，会出现锁冲突。

当表有多个索引的时候，不同的事务可以使用不同的索引锁定不同的行，但是当不同的session查询相同的数据时，同样会阻塞。

当表的数据较少，此时MySQL可能会全盘扫描，此时会导致不使用索引查询，进而导致全表加锁。

MySQL检索的数据类型与索引字段不同，会进行数据转换，但却不会使用索引，所以会导致InnoDB对所有的记录加锁。

3.5 Next-Key锁

当我们使用范围查询，并请求共享或排他锁时，InnoDB会给符合条件的所有索引项加锁，对于在范围内但是不存在的记录，叫做间隙GAP，同时也会被加锁，这个锁叫做Next-Key锁。Next-Key锁时为了防止幻读。

当使用范围检索并锁定记录时，InnoDB会阻塞条件范围内键值的并发插入，这往往会造成严重的锁等待。因此，在实际应用开发中，尤其是并发插入比较多的应用，尽量使用相等条件来访问更新数据，避免使用范围条件。

3.6 什么时候使用行级锁

对于InnoDB，绝大部分情况下都应该使用行级锁，个别特殊事务中，可以考虑使用表级锁。

- 事务需要更新大部分或全部数据，表比较大，如果使用默认的行锁，会造成事务执行效率低，而且可能造成其他事务长时间锁等待和锁冲突。这种情况考虑使用表锁来提高事务的执行速度。

- 事务设计多个表，比较复杂，很可能引起死锁，造成大量事务回滚，此时可考虑使用表锁避免死锁，减少数据库因事务回滚带来的开销。

当然，生产环境中最好不要出现这两种事务，否则就应该考虑MyISAM了。

表锁注意事项：

- 表锁不是由InnoDB存储引擎管理的，而是由MySQL Server负责的，仅当autocommit=0，innodb_table_locas=1(缺省值)时，InnoDB才能知道MySQL加的表锁，也才能感知InnoDB加的行锁，这种情况下，InnoDB才能自动识别涉及表级锁的死锁，否则InnoDB将无法自动检测并处理这种死锁。

- 在用LOCK TABLES对InnoDB加锁时，需要将AUTOCOMMIT设为0，否则不会给表加锁；事务结束前，不要用UNLOCKS TABLES释放表锁，因为UNLOCK TABLES会隐含提交事务；COMMIT或ROLLBACK并不能释放用LOCK TABLES加的表级锁，必须用UNLOCK TABLES释放表锁。

方式如下：写表t1并从表t2读

SET AUTOCOMMIT = 0;

LOCK TABLES t1 WRITE, t2 READ;

[do something..]

COMMIT;

UNLOCK TABLES;

3.7 关于死锁

MyISAM表锁是一次获得所需全部锁，要么全部满足，要么等待，因为不会出现死锁。但InnoDB锁是逐步获得的，所以InnoDB会发生死锁的可能。

比如：session1正在对table_1进行 select for update(获得tb1排他锁) ，此时session2对table_2进行select for update(获得tb2排他锁)，如果此时session1对tb2进行select for update，会出现等待，直到session2释放，但是如果session2没有释放并且又请求tb1进行select for update，那么此时会出现死锁。

发生死锁后，InnoDB一般都能自动检测到，然后释放一个事务锁并回退，另一个事务获得锁继续完成事务。但在涉及外部锁或涉及锁的情况下，InnoDB并不能完全自动检测到死锁，这需要通过设置锁超时参数innodb_lock_wait_timeout来解决，但这个参数并不是用来解决死锁问题，在并发访问比较高的情况下，如果大量事务因无法立即获得所需的锁而挂起，会拖垮数据库，设置合适的值可以避免或者减少此种情况的发生。

通常来说，死锁都是应用设计的问题，通过调整业务流程、数据库对象设计、事务大小，以及访问数据库的SQL语句，绝大部分死锁都可以避免。

避免死锁的常用方法：

- 程序并发存取多个表，尽量约定相同的顺序来访问量。

- 程序批量处理数据的时候，事先对数据排序，保证每个线程按固定的顺序来处理记录。

- 在事务中，如果要更新记录，应该直接申请足够级别的排他锁，而不是先申请共享锁，后申请排他锁。要不然其他事务可能已经获得了相同的共享锁，从而造成锁冲突。

- 在REPEATABLE-READ隔离级别下，如果两个线程同时对相同条件记录用SELECT FOR UPDATE加排他锁，在没有符合条件的记录的情况下，两个线程都会加锁成功。因为两个线程查询均无此记录，便会尝试插入一条新纪录，如果两个线程都这么做，就会出现死锁。这种情况将隔离级别改成READ COMMITTED就可避免。

posted on 2018-08-27 14:55 杜先生的博客阅读(1268) 评论(0) 编辑收藏举报