备份及恢复之Mydumper的使用
介绍
https://launchpad.net/mydumper -----》mydumper官网
MySQL在备份方面包含了自身的mysqldump工具,但其只支持单线程工作,这就使得它无法迅速的备份数据。而mydumper作为一个实用工具,能够良好支持多线程工作,这使得它在处理速度方面十倍于传统的mysqldump。其特征之一是在处理过程中需要对列表加以锁定,因此如果我们需要在工作时段执行备份工作,那么会引起DML阻塞。但一般现在的MySQL都有主从,备份也大部分在从上进行,所以锁的问题可以不用考虑。这样,mydumper能更好的完成备份任务。
mydumper和mysqldump区别
mysqldump是最简单的逻辑备份方式。在备份myisam表的时候,如果要得到一致的数据,就需要锁表,简单而粗暴。而在备份innodb表的时候,加上–master-data=1 –single-transaction 选项,在事务开始时刻,记录下binlog 位置点,然后利用mvcc来获取一致的数据,由于是一个长事务,在写入和更新量很大的数据库上,将产生非常多的undo,显著影响性能。
1) 优点:简单,可针对单表备份,在全量导出表结构的时候尤其有用。
2) 缺点:简单粗暴,单线程,备份慢而且恢复慢,跨IDC有可能遇到时区问题。
mydumper是mysqldump的加强版。相比mysqldump:
3) 内置支持压缩,可以节省2-4倍的存储空间。
4) 支持并行备份和恢复,因此速度比mysqldump快很多,但是由于是逻辑备份,仍不是很快。
mydumper特性
Mydumper主要特性:是一个针对MySQL和Drizzle的高性能多线程备份和恢复工具,开发人员主要来自MySQL,Facebook,SkySQL公司。
-
轻量级C语言写的
-
执行速度比mysqldump快10倍
-
事务性和非事务性表一致的快照(适用于0.2.2以上版本)
-
快速的文件压缩
-
支持导出binlog
-
多线程恢复(适用于0.2.1以上版本)
-
以守护进程的工作方式,定时快照和连续二进制日志(适用于0.5.0以上版本)
-
开源 (GNU GPLv3)
Mydumper 的优势
-
并行能力 (因此有高速度) 和性能 (高效的代码避免了耗费 CPU 处理能力的字符集转换过程)
-
更容易管理输出 (每个表都对应独立的文件,转储元数据等,便于查看/解析数据)
-
一致性 :跨线程维护快照, 提供精确的主从日志定位等。
-
可管理性 : 支持用 PCRE 来包含/排除指定的数据库和表(LCTT译注:PCRE,Perl Compatible Regular Expression,Perl兼容正则表达式)
mydumper安装
yum install glib2-devel mysql-devel zlib-devel pcre-devel
wget https://launchpadlibrarian.net/225370879/mydumper-0.9.1.tar.gz
tar xf mydumper-0.9.1.tar.gz
cd mydumper-0.9.1
cmake .
make
make install
mydumper备份机制
主线程 FLUSH TABLES WITH READ LOCK , 施加全局只读锁,以阻止 DML 语句写入,保证数据的一致性
读取当前时间点的二进制日志文件名和日志写入的位置并记录在 metadata 文件中,以供即使点恢复使用
N 个(线程数可以指定,默认是 4 ) dump 线程 START TRANSACTION WITH CONSISTENT SNAPSHOT ; 开启读一致的事物
dump non-InnoDB tables , 首先导出非事物引擎的表
主线程 UNLOCK TABLES 非事物引擎备份完后,释放全局只读锁
dump InnoDB tables , 基于事物导出 InnoDB 表
事物结束
mydumper参数介绍
-B, --database 要备份的数据库,不指定则备份所有库
-T, --tables-list 需要备份的表,名字用逗号隔开
-o, --outputdir 备份文件输出的目录
-s, --statement-size 生成的insert语句的字节数,默认1000000
-r, --rows 将表按行分块时,指定的块行数,指定这个选项会关闭 --chunk-filesize
-F, --chunk-filesize 将表按大小分块时,指定的块大小,单位是 MB
-c, --compress 压缩输出文件
-e, --build-empty-files 如果表数据是空,还是产生一个空文件(默认无数据则只有表结构文件)
-x, --regex 是同正则表达式匹配 'db.table'
-i, --ignore-engines 忽略的存储引擎,用都厚分割
-m, --no-schemas 不备份表结构
-k, --no-locks 不使用临时共享只读锁,使用这个选项会造成数据不一致
--less-locking 减少对InnoDB表的锁施加时间(这种模式的机制下文详解)
-l, --long-query-guard 设定阻塞备份的长查询超时时间,单位是秒,默认是60秒(超时后默认mydumper将会退出)
--kill-long-queries 杀掉长查询 (不退出)
-b, --binlogs 导出binlog
-D, --daemon 启用守护进程模式,守护进程模式以某个间隔不间断对数据库进行备份
-I, --snapshot-interval dump快照间隔时间,默认60s,需要在daemon模式下
-L, --logfile 使用的日志文件名(mydumper所产生的日志), 默认使用标准输出
--tz-utc 跨时区是使用的选项,不解释了
--skip-tz-utc 同上
--use-savepoints 使用savepoints来减少采集metadata所造成的锁时间,需要 SUPER 权限
--success-on-1146 Not increment error count and Warning instead of Critical in case of table doesn't exist
-h, --host 连接的主机名
-u, --user 备份所使用的用户
-p, --password 密码
-P, --port 端口
-S, --socket 使用socket通信时的socket文件
-t, --threads 开启的备份线程数,默认是4
-C, --compress-protocol 压缩与mysql通信的数据
-V, --version 显示版本号
-v, --verbose 输出信息模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为 2
mydumper示例
导出yh库的数据
mydumper -h 127.0.0.1 -u root -p 123456 -B yh
会在当前目录下出现如下内容
[root@yh ~]# ll
total 4
drwx------ 2 root root 4096 Aug 26 21:08 export-20170826-210835
[root@yh ~]# cd export-20170826-210835/
[root@yh export-20170826-210835]# ll
total 16
-rw-r--r-- 1 root root 75 Aug 26 21:08 metadata -》记录备份开始和结束时间,以及binlog日志文件位置
-rw-r--r-- 1 root root 61 Aug 26 21:08 yh-schema-create.sql ---》存放建库的sql语句
-rw-r--r-- 1 root root 178 Aug 26 21:08 yh.test-schema.sql ---》存放对表的操作sql语句
-rw-r--r-- 1 root root 183 Aug 26 21:08 yh.test.sql ----》存放数据的文件
指定某一个目录
[root@yh ~]# mydumper -h 127.0.0.1 -u root -p 123456 -B yh -o my_sql
[root@yh ~]# ll
total 4
drwx------ 2 root root 4096 Aug 26 21:22 my_sql
[root@yh ~]# ll my_sql/
total 16
-rw-r--r-- 1 root root 75 Aug 26 21:22 metadata
-rw-r--r-- 1 root root 61 Aug 26 21:22 yh-schema-create.sql
-rw-r--r-- 1 root root 178 Aug 26 21:22 yh.test-schema.sql
-rw-r--r-- 1 root root 183 Aug 26 21:22 yh.test.sql
-o参数可以自动创建目录,所以想备到哪里就直接写路径就可以了
不导出表结构
[root@yh ~]# mydumper -h 127.0.0.1 -u root -p 123456 -B yh -m -o my_sql
[root@yh ~]# ll
total 4
drwx------ 2 root root 4096 Aug 26 21:29 my_sql
[root@yh ~]# ll my_sql/
total 8
-rw-r--r-- 1 root root 75 Aug 26 21:29 metadata
-rw-r--r-- 1 root root 183 Aug 26 21:29 yh.test.sql
-----》和上面对比,从这里便可以看出没有建表的sql语句文件《------
只备份单个表
[root@yh ~]# mydumper -h 127.0.0.1 -u root -p 123456 -B yh -T a -o my_backup
[root@yh ~]# ll my_backup/
total 16
-rw-r--r-- 1 root root 75 Aug 26 22:05 metadata
-rw-r--r-- 1 root root 175 Aug 26 22:05 yh.a-schema.sql
-rw-r--r-- 1 root root 169 Aug 26 22:05 yh.a.sql
-rw-r--r-- 1 root root 61 Aug 26 22:05 yh-schema-create.sql
也可以指定多个表中间用逗号分开
使用压缩参数进行压缩
[root@yh ~]# mydumper -h 127.0.0.1 -u root -p 123456 -B yh -T a -c -o my_backup
[root@yh ~]# ll my_backup/
total 16
-rw-r--r-- 1 root root 75 Aug 26 22:12 metadata
-rw-r--r-- 1 root root 170 Aug 26 22:12 yh.a-schema.sql.gz
-rw-r--r-- 1 root root 162 Aug 26 22:12 yh.a.sql.gz
-rw-r--r-- 1 root root 81 Aug 26 22:12 yh-schema-create.sql.gz
一些其他的用法
如果表数据是空,还是产生一个空文件(默认无数据则只有表结构文件)
mydumper -h 127.0.0.1 -u root -p 123456 -B yh --build-empty-files
设置长查询的上限,如果存在比这个还长的查询则退出mydumper,也可以设置杀掉这个长查询
mydumper -h 127.0.0.1 -u root -p 123456 --long-query-guard 200 --kill-long-queries
设置要dump的列表–tables-list,不需要设置db名字,逗号分割
mydumper -h 127.0.0.1 -u root -p 123456 --tables-list=ddd,zzz
通过regex也设置正则表达,需要设置db名字
mydumper -h 127.0.0.1 -u root -p 123456 --regex=test.z
把单表分成多个chunks,这个后面会讲分割的原理
mydumper -h 127.0.0.1 -u root -p 123456 --rows 10000
过滤某个引擎的表
mydumper -h 127.0.0.1 -u root -p 123456 -B test --ignore-engines=innodb
详细日志
mydumper -h 127.0.0.1 -u root -p 123456 -B test -v 3
进行数据恢复
myloader使用参数
-d, --directory 备份文件的文件夹
-q, --queries-per-transaction 每次事物执行的查询数量,默认是1000
-o, --overwrite-tables 如果要恢复的表存在,则先drop掉该表,使用该参数,需要备份时候要备份表结构
-B, --database 需要还原的数据库
-e, --enable-binlog 启用还原数据的二进制日志
-h, --host 主机
-u, --user 还原的用户
-p, --password 密码
-P, --port 端口
-S, --socket socket文件
-t, --threads 还原所使用的线程数,默认是4
-C, --compress-protocol 压缩协议
-V, --version 显示版本
-v, --verbose 输出模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为2
myloader恢复示例
进入数据库drop掉yh库
mysql> drop database yh;
Query OK, 5 rows affected (0.03 sec)
[root@yh ~]# ll my_backup/
total 32
-rw-r--r-- 1 root root 75 Aug 26 22:32 metadata
-rw-r--r-- 1 root root 170 Aug 26 22:32 yh.a-schema.sql.gz
-rw-r--r-- 1 root root 162 Aug 26 22:32 yh.a.sql.gz
-rw-r--r-- 1 root root 171 Aug 26 22:32 yh.b-schema.sql.gz
-rw-r--r-- 1 root root 171 Aug 26 22:32 yh.c-schema.sql.gz
-rw-r--r-- 1 root root 171 Aug 26 22:32 yh.d-schema.sql.gz
-rw-r--r-- 1 root root 170 Aug 26 22:32 yh.e-schema.sql.gz
-rw-r--r-- 1 root root 81 Aug 26 22:32 yh-schema-create.sql.gz
[root@yh ~]# mydumper -h 127.0.0.1 -u root -p 123456 -B yh -d my_backup
进入数据库进行查看
mysql> show databases like 'yh';
+---------------+
| Database (yh) |
+---------------+
| yh |
+---------------+
1 row in set (0.00 sec)
mysql> show tables;
+--------------+
| Tables_in_yh |
+--------------+
| a |
| b |
| c |
| d |
| e |
+--------------+
5 rows in set (0.00 sec)

浙公网安备 33010602011771号