使用pt-duplicate-key-checker工具检查重复及冗余索引 pt-duplicate-key-checker -uroot -proot -h 127.0.0.1
使用SQL判断：select a.table_schema,a.table_name,a.index_name,b.index_name,a.column_name as '重复列名' from statistics a join statistics b ON A.TABLE_SCHEMA=B.TABLE_SCHEMA AND A.TABLE_NAME=B.TABLE_NAME AND A.SEQ_IN_INDEX=B.SEQ_IN_INDEX AND A.COLUMN_NAME=B.COLUMN_NAME WHERE A.SEQ_IN_INDEX = 1 AND A.INDEX_NAME <> B.INDEX_NAME

6.删除不用的索引：在MYSQL中通过慢查日志配合pt-index-usage工具来进行索引使用情况的分析

2.数据库表结构

选择合适的数据类型：

使用可以存下你的数据的最小的数据类型
使用简单的数据类型。Int比varchar类型在mysql处理上更简单
尽可能使用not null定义字段(InnoDB引擎下对允许为null的字段需要使用额外字段存储)
尽量少用text类型，或考虑分表（附加表）

MYSQL数据类型优化示例

使用int替代datetime存储时间：使用函数UNIX_TIMESTAMP()将时间字符串转换为int存储，函数FROM_UNIXTIME将int还原为时间字符串
使用bigint替代varchar存储IP：使用函数INET_ATON('192.168.0.1') 将ip转换为long存储，函数INET_NTOA()将long还原为ip字符串

数据库表的范式化优化：第3范式要求表中不存在非关键字段对任意关键字段的传递函数依赖

如订单表中出现商品描述字段，应该将商品描述放在商品表中

数据库表的反范式化：为了查询效率的考虑把原本符合第3范式的表适当的增加冗余，以优化查询（空间换时间）
垂直拆分(解决表的宽度问题)：将表中不常用字段和text类型字段独立出去，减少常见场景下的查询IO
水平拆分(解决表的数据量问题)：单表数据量过大时考虑将一张表拆根据特定的hash规则分为多张表(表结构一致)
- 拆分后查询效率提升了，但是因为数据被拆分到多张表，处理数据汇总业务时变得难以处理，解决：建一张总表存储全部数据，汇总业务慢慢处理。

3.系统配置

　　MYSQL配置优化(/ect/mysql/my.cnf)

innodb_read_io_threads、innodb_write_io_threads，这两个参数决定InnoDB读写的IO进程数，默认为4，可根据服务器cpu核心与读写业务需求进行调整(V5.5版本后)。
innodb_buffer_pool_size，配置InnoDB的缓冲池大小。如果数据库中只有InnoDB表，则推荐配置量为总内存的75%。列出当前数据库所有表数据+索引的数据大小sql:
select ENGINE,round(sum(DATA_LENGTH+INDEX_LENGTH)/1024/1024,1) as totalMB
from information_schema.TABLES where TABLE_SCHEMA not in
('information_schema','performance_schema') group by ENGINE ;
应该满足条件：innodb_buffer_pool_size >= totalMB (前者单位是字节需要转换)
innodb_buffer_pool_instances MYSQL5.5中新增的参数，可以控制缓冲池的个数，默认只有一个缓冲池。硬件支持的情况下配置多个缓冲池可以提升并发。
innodb_log_buffer_size InnoDB log缓冲的大小，由于日志最长也会每秒刷新所以不用设置太大(能存下一秒的数据即可)
innodb_flush_log_at_trx_commit 决定数据库从缓冲池刷新到磁盘的频率，可选值0/1/2，默认为1(最安全)，表示每次提交都会将数据从缓存刷新至磁盘，0表示定时每1秒将缓存刷新到磁盘，2表示每次提交将数据保存至缓冲区，然后每秒从缓冲区刷新至磁盘。
innodb_file_per_table 控制InnoDB每个表是否使用独立的表空间，默认为OFF，即所有表都会建立在共享表空间中(只有一个文件，会成为竞争资源不利于发挥性能)，建议设置为ON
innodb_stats_on_metadata 决定mysql在什么情况下会刷新innodb表的统计信息。建议设置OFF，避免频繁刷新表信息。

4.硬件（内存/IO/CPU）硬件优化成本最高，效果最差

mysql 隐式字段

DB_TRX_ID：
1.6byte
2.记录创建这条记录时，最后一次修改该数据的事务ID(初始为空)

DB_ROLL_PTR:
1.7byte，回滚指针
2.指向这条记录上一个版本(存储于rollback segment回滚段里)

DB_ROW_ID
1.6byte ，隐藏的自增ID（隐藏主键）
2.如果数据表没有主键，innoDB会自动以DB_ROW_id产生一个聚簇索引

posted on 2023-01-03 09:40 一棵二叉树阅读(99) 评论(0) 收藏举报

刷新页面返回顶部

导航