MySQL优化-常用方法
小型项目可能对数据库要求没有那么大,但是对于百万千万级以上数据,查询等数据库便会有显著下降,以下是个人项目中用到的方法(持续补充中...):
1.创建数据库
(1)使用合适的数据类型。能用char就不用varchar,能用mediumint就不用bigint。减少不必要的空间开销。
(2)合理使用外键。
2.查询数据库
(1)使用join代替子查询。
(2)使用union代替临时表创建。
(3)查询需要的字段。
(4)减少比较操作,像like之类的。
3.索引[主键索引|唯一索引|普通索引|全文索引|空间索引]
合理创建索引
4.分区分表(瓶颈为单库容量)
- 概念
分区(图书的章节) 就是把一张表的数据分成N个区块,在逻辑上看最终只是一张表,但底层是由N个物理区块组成的
分表(图书馆的图书) 就是把一张表按一定的规则分解成N个具有独立存储空间的实体表。系统读写时需要根据定义好的规则得到对应的字表明,然后操作它。
分库(图书馆,未使用过不做详细介绍) 一旦分表,一个库中的表会越来越多。
- 使用场景
(1)分区
-
一张表的查询速度已经慢到影响使用的时候。
-
sql经过优化
-
数据量大
- 表中的数据是分段的
-
对数据的操作往往只涉及一部分数据,而不是所有的数据
(2)分表
-
一张表的查询速度已经慢到影响使用的时候。
-
sql经过优化
- 数据量大
-
当频繁插入或者联合查询时,速度变慢
- 操作
(1)分区
新建表:
//range分区方式
drop table if exists staff; create table staff( id int not null, fname varchar(30), lname varchar(30), hired date not null default '1970-01-01', separated date not null default '9999-12-31', job_code int not null default 0, store_id int not null default 0 )engine=myisam default charset=utf8 partition by range(year(separated))( partition p0 values less than (1991), partition p1 values less than (1996), partition p2 values less than (2001), partition p4 values less than MAXVALUE );
//hash分区方式
drop table if exists staff;
create table staff( id int not null, fname varchar(30), lname varchar(30), hired date not null default '1970-01-01', separated date not null default '9999-12-31', job_code int not null default 0, store_id int not null default 0 ) partition by hash(store_id) partitions 4;
less than MAXVALUE一定要注意添加,要不然超出范围将报错。
删除表:
alter table staff drop partition p0;
查询表:
select count(*) from staff where year(separated) = 200 group by store_id; //自动查询p2分区
5.数据库引擎
6.读写分离(配置)
适用场景:读操作远远多于写操作
目标:有效减轻Master库的压力,又可以把用户查询数据的请求分发到不同的Slave库,从而保证系统的健壮性。
实现方式1:应用内部路由
不推荐!需要应用内切换数据源且实现高可用。个人也没有用过。

实现方式2:代理
个人用的是mysql-proxy代理中间件,可配置
缺点:增加了一层,网络消耗伴随增加

7.预处理
使用Redis/ElasticSearch
这是第三方组件完成的缓存机制
如何定位查询慢的语句:
利用数据库慢查询功能,设置步骤如下
(1)临时开启慢查询(永久开启得改/etc/my.cfg)
set gloabal slow_query_log=on(对应的关闭为off)
(2)设置时间长度,超过的语句将被记录
set long_query_time=5(单位秒)
(3)存储方式设为file
set log_output=file(默认为null,还支持table,数据将放在slow_log表中)
(4)查看存储位置
show variables like '%query%'
文件位置为slow_query_log_file
(5)拿到第4步的sql语句,执行explain+SQL语句
作用:
- 表的读取顺序
- 数据读取操作的操作类型
- 哪些索引可以使用
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
分析得到的数据:
| 信息 | 描述 |
| id | 查询的序号,包含一组数字,表示查询中执行select子句或操作表的顺序 **两种情况** id相同,执行顺序从上往下 id不同,id值越大,优先级越高,越先执行 |
| select_type | 查询类型,主要用于区别普通查询,联合查询,子查询等的复杂查询 1、simple ——简单的select查询,查询中不包含子查询或者UNION 2、primary ——查询中若包含任何复杂的子部分,最外层查询被标记 3、subquery——在select或where列表中包含了子查询 4、derived——在from列表中包含的子查询被标记为derived(衍生),MySQL会递归执行这些子查询,把结果放到临时表中 5、union——如果第二个select出现在UNION之后,则被标记为UNION,如果union包含在from子句的子查询中,外层select被标记为derived 6、union result:UNION 的结果 |
| table | 输出的行所引用的表 |
| type | 显示联结类型,显示查询使用了何种类型,按照从最佳到最坏类型排序 1、system:表中仅有一行(=系统表)这是const联结类型的一个特例。 2、const:表示通过索引一次就找到,const用于比较primary key或者unique索引。因为只匹配一行数据,所以如果将主键置于where列表中,mysql能将该查询转换为一个常量 3、eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于唯一索引或者主键扫描 4、ref:非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,可能会找多个符合条件的行,属于查找和扫描的混合体 5、range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引,一般就是where语句中出现了between,in等范围的查询。这种范围扫描索引扫描比全表扫描要好,因为它开始于索引的某一个点,而结束另一个点,不用全表扫描 6、index:index 与all区别为index类型只遍历索引树。通常比all快,因为索引文件比数据文件小很多。 7、all:遍历全表以找到匹配的行 注意:一般保证查询至少达到range级别,最好能达到ref。 |
| possible_keys | 指出MySQL能使用哪个索引在该表中找到行 |
| key | 显示MySQL实际决定使用的键(索引)。如果没有选择索引,键是NULL。查询中如果使用覆盖索引,则该索引和查询的select字段重叠。 |
| key_len | 表示索引中使用的字节数,该列计算查询中使用的索引的长度在不损失精度的情况下,长度越短越好。如果键是NULL,则长度为NULL。该字段显示为索引字段的最大可能长度,并非实际使用长度。 |
| ref | 显示索引的哪一列被使用了,如果有可能是一个常数,哪些列或常量被用于查询索引列上的值 |
| rows | 根据表统计信息以及索引选用情况,大致估算出找到所需的记录所需要读取的行数 |
| Extra | 包含不适合在其他列中显示,但是十分重要的额外信息 1、Using filesort:说明mysql会对数据适用一个外部的索引排序。而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成排序操作称为“文件排序” 2、Using temporary:使用了临时表保存中间结果,mysql在查询结果排序时使用临时表。常见于排序order by和分组查询group by。 3、Using index:表示相应的select操作用使用覆盖索引,避免访问了表的数据行。如果同时出现using where,表名索引被用来执行索引键值的查找;如果没有同时出现using where,表名索引用来读取数据而非执行查询动作。 4、Using where :表明使用where过滤 5、using join buffer:使用了连接缓存 6、impossible where:where子句的值总是false,不能用来获取任何元组 7、select tables optimized away:在没有group by子句的情况下,基于索引优化Min、max操作或者对于MyISAM存储引擎优化count(*),不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。 8、distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。 |

浙公网安备 33010602011771号