MySQL的binlog有啥用?谁写的?在哪里?怎么配置

一、唠嗑

文章公号 首发!连载中!关注微信公号回复:“抽奖” 还可参加抽📖活动

算上这一篇文章,白日梦的MySQL专题已经写了18篇了。前面的文章中有跟大家分享过undo log、redo log、以及接下来要有几篇文章跟大家分享bin log。

前一阵跟一个同学唠嗑,说到了MySQL的这几个日志。那同学就感觉这几个日志挺深奥的挺难懂的。其实不用这么吓唬自己。

就比如说这几个日志,你有没有想过MySQL为啥要写日志呢?写日志就得有磁盘IO、不写不香吗?速度、性能还会变快。其实不然,MySQL会写日志,是因为记录下的日志能赋予MySQL一定的能力。

比如undo log让mysql有回滚事物的能力,redo log让mysql有崩溃恢复的能力,以及我们现在说的bin log让MySQL有搭建集群、数据备份、恢复数据的能力。

那你说,我不想让MySQL记录那些日志不行吗?肯定行啊!甚至默认情况下,MySQL都不会主动为你记录bin log ,但是话说回来,你不让它写那些日志,它就没有相应的能力给你用。是吧!所以综合来说,写日志还是很香的。

知道了这些,再去学相关的知识点是不是目的性很强了呢?关于undo log、redo log白日梦前面已经和大家分享过了,知无不言的那种分享哈,如果你又有感觉了,欢迎关注我然后去翻看。

对于大部分研发同学来说,肯定听说过bin log。然后却不一定知道binlog在哪里?谁写的?怎么配置binlog?以及binlog有啥用。所以接下来的几篇文章,我们一起看看binlog的二三事,让你更好的理解binlog。


二、什么是bin log?

bin log是MySQL的二进制日志文件,翻译成中文名反到是感觉怪怪的。所以说下面直接称他为binlog。

我们都知道MySQL分为两大部分。上层是MySQL-Server,下层是可插拔的存储引擎。

binlog就是由MySQL的Server层产生。


三、它在哪里?

binlog存放的位置由datadir参数控制。

你可以通过下面的方式查看到它

知道了binlog具体在哪里,你就可以看一眼,如下

目录下有两种文件:mysql-bin.0000XX 和 mysql-bin.index

前者保存着对MySQL更改的逻辑

而后者长下面这样,估计你一看就懂了~


四、bin log的相关配置

一般关于binlog的配置都写在MySQL的配置文件中: my.cnf , 以方便启动mysql时直接让这些配置生效

作为了解,你可以大概搂一眼binlog的配置项

[mysqld]
# binlog相关配置

# 指定binlog日志存储的位置
datadir                  = /home/mysql/mysql/var

# 规范binlog的命名为 mysql-bin.0000XX
# 如果加这行配置,binlog文件名为主机名
log-bin                  = mysql-bin

# 索引当前所有的binlog
log-bin-index            = mysql-bin.index

# 最大的大小
max_binlog_size          = 1G

# binlog的sync时机
sync-binlog              = 1

# binlog的格式
binlog-format            = ROW

# 保留七天的binlog
expire_logs_days = 7 

五、binlog 有啥用?

如果说redolog中记录的是偏向物理层面的记录,如:对哪个数据页的那个记录做了什么修改。

那么binlog中记录的是偏向逻辑层面的记录:如:对xxx表中的id=yyy的行做做了什么修改,更改后的值是什么。

binlog不会记录你的 select 、show这类的操作。

你可以在query log中找到曾经执行过的诸如select、show这种仅查询的SQL。

常见的binlog有如下的作用。

  1. delete没加where条件?不慌!binlog可以帮你恢复数据
  2. 搭建一套一主两从的MySQL集群,binlog帮你完成主从的数据同步。
  3. 审计,通过分析binlog可以排查是否存在SQL注入攻击。

但是你知道吗?

默认binlog是不开启的。因为开启binlog后会稍微降低一点mysql的性能(1%)。

但是开启binlog后你就可以搭建MySQL集群,排查SQL注入,恢复误删的数据。所以线上的MySQL集群都是开启binlog的,是不是感觉开启binlog很有保障!很香呢?


六、超有用的参数 sql_log_bin

跟大家分享一种线上实际存在的场景,你就能知道该参数的妙用了。

比如你线上使用的是一个一主两从的MySQL集群,然后有一个活动来了,你需要给线上某库的某数据表添加一列,并且这个表里面的数量非常之庞大。

添加一列是需要获取表锁的,并且庞大的数据量让你alter table异常缓慢,在获取表锁的过程中,正常的DML也会被阻塞。这时你就得考虑无损DDL,比如golang的ghost(怎么做的无损ddl原理我后门的文章会写的,本篇不展开)。

ghost工具的特点是,它需要预执行一些SQL目的是先校验一下你的集群符不符合它的要求,为了不对线上产生影响,你肯定会想把这些预执行的sql放到从库上执行。放在从库上执行固然没问题,但是你执行的sql会产生bin log。出现新的GTID(后面讲MySQL集群时会跟大家分享,这里你只需要理解成是一个事物的唯一标识就行)更要命的是,主库中没有这些GTID。

当主从都正常运行时,主从bin log不一致没关系,但是当从库宕机的时候,从库重启会将自己的GTID集合发送给主库,由于从库多出来一部分主库没有的GTID,会导致该从库不能再次加入集群。

其实这个问题也好解决。使用这个参数 sql_log_bin

sql_log_bin变量控制是否为当前会话启用到二进制日志的日志记录(假设二进制日志本身已启用)。默认值为ON。要为当前会话禁用或启用二进制日志记录,请将会话sql_log_bin变量设置为 OFFON

全局sql_log_bin变量是只读的,无法修改。


七、未来几篇文章

本文到这里就行将结束了,概括性的在各个方面讲述了一下binlog,让你对binlog有了一个大概的了解。

在后续的几篇文章中我会尝试针对binlog的某个点展开问答式的叙述。如下,欢迎关注,敬请期待。

binlog的写入时机?binlog到底长啥样?有哪些格式?各种格式的binlog的优缺点?恢复数据?

关于 “搭建一套一主两从的MySQL集群,binlog帮你完成主从的数据同步。”会放在MySQL集群部分穿插串讲起来。

参考:

https://dev.mysql.com/doc/refman/5.7/en/binary-log.html

https://dev.mysql.com/doc/refman/5.7/en/replication-options-binary-log.html

https://dev.mysql.com/doc/refman/5.7/en/set-sql-log-bin.html


推荐阅读

  1. 大家常说的基数是什么?(已发布)

  2. 讲讲什么是慢查!如何监控?如何排查?(已发布)

  3. 对NotNull字段插入Null值有啥现象?(已发布)

  4. 能谈谈 date、datetime、time、timestamp、year的区别吗?(已发布)

  5. 了解数据库的查询缓存和BufferPool吗?谈谈看!(已发布)

  6. 你知道数据库缓冲池中的LRU-List吗?(已发布)

  7. 谈谈数据库缓冲池中的Free-List?(已发布)

  8. 谈谈数据库缓冲池中的Flush-List?(已发布)

  9. 了解脏页刷回磁盘的时机吗?(已发布)

  10. 用十一张图讲清楚,当你CRUD时BufferPool中发生了什么!以及BufferPool的优化!(已发布)

  11. 听说过表空间没?什么是表空间?什么是数据表?(已发布)

  12. 谈谈MySQL的:数据区、数据段、数据页、数据页究竟长什么样?了解数据页分裂吗?谈谈看!(已发布)

  13. 谈谈MySQL的行记录是什么?长啥样?(已发布)

  14. 了解MySQL的行溢出机制吗?(已发布)

  15. 说说fsync这个系统调用吧! (已发布)

  16. 简述undo log、truncate、以及undo log如何帮你回滚事物! (已发布)

  17. 我劝!这位年轻人不讲MVCC,耗子尾汁! (已发布)

  18. MySQL的崩溃恢复到底是怎么回事? (已发布)

  19. MySQL的binlog有啥用?谁写的?在哪里?怎么配置 (已发布)



posted @ 2020-12-12 19:11  赐我白日梦  阅读(1060)  评论(0编辑  收藏  举报