MYSQL优化思路总结

mysql 执行 sql步骤

client
server ---> 连接器 --> 解析器 ---> 抽象语法树 ---> 优化器（Rbo 基于规则， Cbo 基于成本）
执行器（与存储引擎交互）
存储引擎

磁盘预读最小单位页大小是4K ，预读N4K

innodb 默认预读16K，4页

性能监控

sql执行各步骤执行时间

mysql最大连接数
- show variables like 'max_connections';
线程连接数，分配线程数量
- show status like '%thread%';

show profile

set profiling=1;

查询所有 Query_ID
show profiles;

all：显示所有性能信息
show profile all for query n

block io：显示块io操作的次数
show profile block io for query n

context switches：显示上下文切换次数，被动和主动
show profile context switches for query n

cpu：显示用户cpu时间、系统cpu时间
show profile cpu for query n

IPC：显示发送和接受的消息数量
show profile ipc for query n

page faults：显示页错误数量
show profile page faults for query n

source：显示源码中的函数名称与位置
show profile source for query n

swaps：显示swap的次数
show profile swaps for query n

performance_schema

使用show processlist

SELECT
	COUNT(1) 
FROM
	INFORMATION_SCHEMA.PROCESSLIST

拼接sql，对阻塞连接进行kill

SET SESSION group_concat_max_len = 102400;
SELECT
	GROUP_CONCAT( CONCAT( 'kill ', id, ';' ) SEPARATOR '' ) 
FROM
	`information_schema`.`PROCESSLIST` 
WHERE
	HOST = '%'

查看连接的线程个数，来观察是否有大量线程处于不正常的状态或者其他不正常的特征
host表示操作的主机
db表示操作的数据库
command表示当前状态
- sleep：线程正在等待客户端发送新的请求
- query：线程正在执行查询或正在将结果发送给客户端
- locked：在mysql的服务层，该线程正在等待表锁
- analyzing and statistics：线程正在收集存储引擎的统计信息，并生成查询的执行计划
- Copying to tmp table：线程正在执行查询，并且将其结果集都复制到一个临时表中
- sorting result：线程正在对结果集进行排序
- sending data：线程可能在多个状态之间传送数据，或者在生成结果集或者向客户端返回数据

数据类型的优化

varchar根据实际内容长度保存数据
char固定长度的字符串
1. 最大长度：255
2. 会自动删除末尾的空格
3. 检索效率、写效率会比varchar高，以空间换时间
4. 应用场景存储长度波动不大的数据，如：md5摘要
5. 存储短字符串、经常更新的字符串
datetime
- 占用8个字节、可保存到毫秒、可保存时间范围大
timestamp
- 占用4个字节、时间范围：1970-01-01到2038-01-19、
- 精确到秒、采用整形存储、自动更新timestamp列的值
date
- 占用的字节数比使用字符串、datetime、int存储要少，使用date类型只需要3个字节
- 使用date类型还可以利用日期时间函数进行日期之间的计算
- date类型用于保存1000-01-01到9999-12-31之间的日期

索引

InnoDB , MyISAM底层 B+tree
MyISAM 的 B+tree 数据与索引分开存储，B+树中存储的是实际数据所在的地址
InnoDB 的 B+tree 数据与索引一起存储

在mysql中，只有memory的存储引擎显式支持哈希索引
哈希索引基于哈希表的实现，只有精确匹配索引所有列的查询才有效，范围查询无效

使用索引注意事项

通配符%不能放在前面，不然索引失效
匹配范围
全匹配
精确匹配

索引数据结构演变过程

二叉树（ 容易倾斜，节点过深 ）
平衡二叉树（ 最长子树与最短子树高度差不能超过1 ，节点过深）
- 必须进行旋转， 1-N次旋转，旋转浪费时间
- 插入删除效率极低，查询效率高
红黑树（ 旋转 + 变色 ，减少旋转次数+变色）
- 红黑树是对平衡二叉树的优化，提升了插入删除效率，但是也损失了查询效率
- 最长子树不超过最短子树高度2倍即可
- 变色（减少旋转次数）：任何一个单个分支中，不能连续出现两个红色节点
- 根到所有树路径，所有路径中黑色节点的数量一致
-------------------有且仅有两个节点，数据多后，节点过深， IO次数增多-------------------------------------------
B树
B+树优化了B树，数据只存储在叶子节点，非叶子节点存储Key

避免哈希冲突 ---> 编写优秀的哈希算法

mysql默认会给唯一字段建立索引，主键是唯一且非空字段

主键索引

唯一索引

普通索引

全文索引（ text字段）

组合索引

组合索引中范围查询放在前面，后面索引失效

面试索引

回表
- 普通索引叶子节点放的是主键，通过主键回表查询其他字段
覆盖索引（执行计划中Extra提示 usring index ）
- 不需要回表，直接查出需要数据比如：查询id
最左匹配
- 组合索引的适配最左匹配
索引下推
- 在存储引擎处理组合索引时，将where后多个条件一起过滤，不用在server端进行过滤，减少IO
索引合并
- 若单独建立索引，高版本会在优化器中进行合并
页合并
页分裂

order by 利用索引扫描进行排序， Extra中 index ，索引如果不能覆盖查询全部列就会出现每扫描一列就回表查询对应的行，回表增加随机IO次数
using filesort 文件排序，Extra中 Null为使用了索引排序
索引默认是升序排序，一个SQL中同时出现desc 和 asc 的话，索引order by失效

存储引擎

InnoDB MyISAM Memory

执行计划

Cardinality 基数

OLAP OLTP

JOIN

小表JOIN大表
小表可以放在内存里面，大表放在内存里面，mapjoin
通过JOIN 进行优化子查询

limit优化，当分页的表行数很多时，为了避免逐条遍历，使用JOIN进行多表JOIN
直接使用limit 进行分页，逐条遍历数据，然后取5条

select * from table t1 JOIN (select id from table limit 10000000,5) t2 ON t1.id = t2.id;

union

union
union all
minus

锁

innodb 支持表锁和行锁，行锁是加在索引上面的，若没有索引，则采取表锁

for update：IX锁(意向排它锁)，即在符合条件的rows上都加了排它锁
lock in share mode：是IS锁(意向共享锁)，即在符合条件的rows上都加了共享锁
排它锁：X锁、写锁，事务A对一个资源加了X锁后只有A本身能对该资源进行读和写操作，其他事务对该资源的读和写操作都将被阻塞，直到A释放锁为止
共享锁：S锁、读锁，事务A锁定的数据其他事务可以共享读该资源，但不能写，直到事务A释放
Next-Key Lock是Gap Lock（间隙锁）和Record Lock（行锁）的结合版，都属于Innodb的锁机制

MyISAM 支持表锁

MySQL的表级锁有两种模式：表共享读锁（Table Read Lock）和表独占写锁（Table Write Lock）。
MyISAM 默认开启共享读锁和独占写锁，不需要使用命令来显式加锁

服务器参数

最大连接数 ---默认151

SHOW VARIABLES like '%max_connections%'

用户最大连接数
- max_user_connections
mysql能够暂存的连接数量，当mysql的线程在一个很短时间内得到非常多的连接请求时，就会起作用，如果mysql的连接数量达到max_connections时，新的请求会被存储在堆栈中，以等待某一个连接释放资源，如果等待连接的数量超过back_log,则不再接受连接资源
- back_log ---默认80
mysql在关闭一个非交互的连接之前需要等待的时长
- wait_timeout
关闭一个交互连接之前需要等待的秒数
- interactive_timeout

日志

SHOW VARIABLES like '%query_log%'

当数据修改时，innodb引擎会将记录写到redo log中，并更新内存，并在合适时机将记录操作到磁盘中

redo log是固定大小的，是循环写的过程

有redo log ，innodb就可以保证即使数据库发生异常重启，之前的记录也不会丢失，叫做crash-safe

redo 循环写
undo
两种属于innodb层面，
ACID 原子性，一致性，隔离性，持久性

undo日志实现事物的原子性，在Mysql Innodb存储引擎中实现多版本并发控制（MVCC），undo log 存储了数据备份，如果出现错误或者用户执行了ROLLBACK语句，系统可以利用Undo Log中的备份将数据恢复到十五开始之前的状态

undo log是逻辑日志:

当删除一条记录，undo log中会记录一条对应的insert插入记录

隔离级别通过锁实现，持久性通过redo日志实现

MyISAM 中不能使用redo 和 undo log

binlog 属于 mysql server，记录的是这个语句的原始逻辑
binlog 追加写

慢查询日记

slow_query_log 是否开启慢查询日志记录
slow_query_log_file 指定慢查询日志文件名称，用于记录耗时比较长的查询语句
long_query_time 设置慢查询的时间，超过这个时间的查询语句才会记录日志

缓存

SHOW VARIABLES like '%query_cache%'

索引缓存区的大小（只对myisam表起作用）

key_buffer_size

线程缓存大小 thread_cache_size 默认9

相当于自带的线程池，线程个数

posted @ 2020-09-23 14:56 爪哇搬砖阅读(223) 评论(0) 收藏举报

刷新页面返回顶部

爪哇搬砖

Mr.Li

MYSQL优化思路总结

mysql 执行 sql步骤

磁盘预读 最小单位页 大小是4K ， 预读N4K

innodb 默认预读16K，4页

性能监控

sql执行各步骤执行时间

show profile

performance_schema

使用show processlist

数据类型的优化

索引

使用索引注意事项

索引数据结构演变过程

避免哈希冲突 ---> 编写优秀的哈希算法

mysql默认会给唯一字段建立索引，主键是唯一且非空字段

主键索引

唯一索引

普通索引

全文索引 （ text字段 ）

组合索引

面试索引

存储引擎

执行计划

Cardinality 基数

JOIN

union

锁

innodb 支持表锁和行锁，行锁是加在索引上面的，若没有索引，则采取表锁

MyISAM 支持表锁

服务器参数

日志

当数据修改时，innodb引擎会将记录写到redo log中，并更新内存 ， 并在合适时机将记录操作到磁盘中

redo log是固定大小的，是循环写的过程

有redo log ，innodb就可以保证即使数据库发生异常重启，之前的记录也不会丢失，叫做crash-safe

undo日志实现事物的原子性 ，在Mysql Innodb存储引擎中 实现多版本并发控制（MVCC），undo log 存储了数据备份，如果出现错误或者用户执行了ROLLBACK语句，系统可以利用Undo Log中的备份将数据恢复到十五开始之前的状态

MyISAM 中不能使用redo 和 undo log

慢查询日记

缓存

公告

磁盘预读最小单位页大小是4K ，预读N4K

全文索引（ text字段）

当数据修改时，innodb引擎会将记录写到redo log中，并更新内存，并在合适时机将记录操作到磁盘中

undo日志实现事物的原子性，在Mysql Innodb存储引擎中实现多版本并发控制（MVCC），undo log 存储了数据备份，如果出现错误或者用户执行了ROLLBACK语句，系统可以利用Undo Log中的备份将数据恢复到十五开始之前的状态