欢迎光临,赤鹿小组
记录过程,分享经验

Mydumper高性能多线程备份和恢复工具

MySQL自身的mysqldump工具支持单线程工作,依次一个个导出多个表,没有一个并行的机,这就使得它无法迅速的备份数据。mydumper作为一个实用工具,能够良好支持多线程工作,可以并行的多线程的从表中读入数据并同时写到不同的文件里,这使得它在处理速度方面快于传统的mysqldump。其特征之一是在处理过程中需要对列表加以锁定,因此如果我们需要在工作时段执行备份工作,那么会引起DML阻塞。但一般现在的MySQL都有主从,备份也大部分在从上进行,所以锁的问题可以不用考虑。这样,mydumper能更好的完成备份任务。

mydumper特性

  • 多线程备份
  • 因为是多线程逻辑备份,备份后会生成多个备份文件
  • 备份时对MyISAM表施加FTWRL(FLUSH TABLES WITH READ LOCK),会阻塞DML语句
  • 保证备份数据的一致性
  • 支持文件压缩
  • 支持导出binlog
  • 支持多线程恢复
  • 支持以守护进程模式工作,定时快照和连续二进制日志
  • 支持将备份文件切块

mydumper安装

wget https://github.com/maxbube/mydumper/releases/download/v0.9.5/mydumper-0.9.5-2.el7.x86_64.rpm
rpm -ivh mydumper-0.9.5-2.el7.x86_64.rpm

安装完成后生成两个二进制文件mydumper和myloader位于/usr/local/bin目录下

主要步骤概括

  • 主线程 FLUSH TABLES WITH READ LOCK, 施加全局只读锁,以阻止DML语句写入,保证数据的一致性
  • 读取当前时间点的二进制日志文件名和日志写入的位置并记录在metadata文件中,以供即使点恢复使用
  • N个(线程数可以指定,默认是4)dump线程 START TRANSACTION WITH CONSISTENT SNAPSHOT; 开启读一致的事物
  • dump non-InnoDB tables, 首先导出非事物引擎的表
  • 主线程 UNLOCK TABLES 非事物引擎备份完后,释放全局只读锁
  • dump InnoDB tables, 基于事物导出InnoDB表
  • 事物结束

备份所生成的文件

所有的备份文件在一个目录中,目录可以自己指定.

目录中包含一个metadata文件
 - 记录了备份数据库在备份时间点的二进制日志文件名,日志的写入位置,
 - 如果是在从库进行备份,还会记录备份时同步至主库的二进制日志文件及写入位置

每个表有两个备份文件:
 - database.table-schema.sql 表结构文件
 - database.table.sql 表数据文件

如果对表文件分片,将生成多个备份数据文件,可以指定行数或指定大小分片

mydumper和myloader的使用

mydumper参数

-B, –database 要备份的数据库,不指定则备份所有库
-T, –tables-list 需要备份的表,名字用逗号隔开
-o, –outputdir 备份文件输出的目录
-s, –statement-size 生成的insert语句的字节数,默认1000000
-r, –rows 将表按行分块时,指定的块行数,指定这个选项会关闭 –chunk-filesize
-F, –chunk-filesize 将表按大小分块时,指定的块大小,单位是 MB
-c, –compress 压缩输出文件
-e, –build-empty-files 如果表数据是空,还是产生一个空文件(默认无数据则只有表结构文件)
-x, –regex 是同正则表达式匹配 ‘db.table’
-i, –ignore-engines 忽略的存储引擎,用都厚分割
-m, –no-schemas 不备份表结构
-k, –no-locks 不使用临时共享只读锁,使用这个选项会造成数据不一致
–less-locking 减少对InnoDB表的锁施加时间(这种模式的机制下文详解)
-l, –long-query-guard 设定阻塞备份的长查询超时时间,单位是秒,默认是60秒(超时后默认mydumper将会退出)
–kill-long-queries 杀掉长查询 (不退出)
-b, –binlogs 导出binlog
-D, –daemon 启用守护进程模式,守护进程模式以某个间隔不间断对数据库进行备份
-I, –snapshot-interval dump快照间隔时间,默认60s,需要在daemon模式下
-L, –logfile 使用的日志文件名(mydumper所产生的日志), 默认使用标准输出
–tz-utc 跨时区是使用的选项,不解释了
–skip-tz-utc 同上
–use-savepoints 使用savepoints来减少采集metadata所造成的锁时间,需要 SUPER 权限
–success-on-1146 Not increment error count and Warning instead of Critical in case of table doesn’t exist
-h, –host 连接的主机名
-u, –user 备份所使用的用户
-p, –password 密码
-P, –port 端口
-S, –socket 使用socket通信时的socket文件
-t, –threads 开启的备份线程数,默认是4
-C, –compress-protocol 压缩与mysql通信的数据
-V, –version 显示版本号
-v, –verbose 输出信息模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为 2

myloader参数

-d, –directory 备份文件的文件夹
-q, –queries-per-transaction 每次事物执行的查询数量,默认是1000
-o, –overwrite-tables 如果要恢复的表存在,则先drop掉该表,使用该参数,需要备份时候要备份表结构
-B, –database 需要还原的数据库
-e, –enable-binlog 启用还原数据的二进制日志
-h, –host 主机
-u, –user 还原的用户
-p, –password 密码
-P, –port 端口
-S, –socket socket文件
-t, –threads 还原所使用的线程数,默认是4
-C, –compress-protocol 压缩协议
-V, –version 显示版本
-v, –verbose 输出模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为2

使用案例——

mydumper

全库备份
mydumper -h ${sql_ip}  -u${user} -p${passwd} -o ${backupdir} -c -e -t 16
单库备份
mydumper -h ${sql_ip}  -u${user} -p${passwd} -o ${backupdir} -B ${database} -c -e -t 16
表备份
mydumper -u${user} -p${passwd} -o ${backupdir} -B ${database} -T ${table1},${table2} -c -e -t 16

ps: -t 后面为线程数 不设置线程数默认是4线程

myloader

恢复
myloader -S ${dir}}/mysql.sock(-h${IP}) -u${user} -p${passwd} -B ${database} -o -d ${backupdir} -t 16 -v 3

ps: -v 3显示详细的日志

赞(0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址