作者:微信小助手
发布时间:2023-01-12T15:13:14
本文主要内容如下: 为了保证高可用,之前在测试环境部署了一套 MySQL 双主模式,当一个主库服务出现异常,可以将流量切到另外一个主库,两个主库之间相互同步数据。 双主模式的原理图如下: 但是经常出现数据冲突的问题,于是我们又把 另外从库复制的模式采用 虽然改为了主从模式,但依旧遇到了些问题: 这篇我们来探讨下问题 4 和问题 6。 其中问题 4 是一个比较头疼的问题,我们一般是通过查看从库 B 当前的同步状态拿到同步位点,然后设置同步位点后。但是重新启动同步的时候又会出现同步异常,比如从库 B 可能会出现 Duplicate entry ‘id_of_R’ for key ‘PRIMARY’ 错误,提示出现了主键冲突,然后停止同步。 为了减少位点同步引入的复杂度,我们切换成了 GTID 模式。 对于问题 6,本篇也仅限于探讨如何观察延迟,对于如何减少延迟不在本篇探讨范围之内。 接下来我们来展开看下位点同步的痛点。 为了更清晰地理解主从采用位点同步的原理,这里有一个原理图: 1、主库会生成多个 binlog 日志文件。 2、从库的I/O 线程请求指定文件和指定位置的 binlog 日志文件(位点)。 3、主库 dump 线程获取指定位点的 binlog 日志。 4、主库按照从库发送给来的位点信息读取 binlog,然后推送 binlog 给从库。 5、从库将得到的 binlog 写到本地的 relay log (中继日志) 文件中。 6、从库的 SQL 线程读取和解析 relay log 文件。 7、从库的 SQL 线程重放 relay log 中的命令。 当我们使用位点同步的方式时,两种场景下的操作步骤比较复杂。 不论是首次开启同步时需要找位点和设置位点,还是恢复主从复制时,设置位点和忽略错误,这些步骤都显得过于复杂,而且容易出错。所以 MySQL 5.6 版本引入了 GTID,彻底解决了这个困难。 GTID 的全称是 Global Transaction Identifier,全局事务 ID,当一个事务提交时,就会生成一个 GTID,相当于事务的唯一标识。 GTID 长这样: 结构: server_uuid 是一个实例第一次启动时自动生成的,是一个全局唯一的值; gno 是一个整数,初始值是 1,每次提交事务的时候分配给这个事务,并加 1。 每个 MySQL 实例都维护了一个 GTID 集合,用来对应“这个实例执行过的所有事务”。 1、更简单的实现 failover,不用以前那样在需要找位点(log_file 和 log_pos)。 2、更简单的搭建主从复制。 3、比传统的复制更加安全。 4、GTID是连续的没有空洞的,保证数据的一致性,零丢失。 修改主库和从库的配置文件: 从库配置同步的参数: 其中 master_auto_position 标识主从关系使用的 GTID 协议。 相比之前的配置,MASTER_LOG_FILE 和 MASTER_LOG_POS 参数已经不需要了。 GTID 同步的原理图。 GTID 方案:主库计算主库 GTID 集合和从库 GTID 的集合的差集,主库推送差集 binlog 给从库。 当从库设置完同步参数后,主库 A 的GTID 集合记为集合 x,从库 B 的 GTID 集合记为 y。从库同步的逻辑如下: GTID 同步方案和位点同步的方案区别是: 上面提到的问题 6 是主从读写分离后,从库复制存在延迟,接下来我们来探讨下如何观察主从延迟多少的问题。 方案一:判断从库的同步状态参数 seconds_behind_master 是否为 0。(不准确) 方案二:对比位点确保主备无延迟。 方案三:对比 GTID 集合确保主备无延迟。 可以在从库上执行 slow slave status 命令来看执行结果里面的 Seconds_Behind_Master 的单位是秒,所以精度不准确。 所以为了保证查询的数据是和主库一致的,就需要先判断 seconds_behind_master 是否已经等于 0,如果不等于 0,就必须等到这个参数变为 0 才能执行查询请求。 可以通过查看从库当前的同步位点来确认从库同步是否有延迟。下图是在从库上执行 如果红色框起来的两个参数: 如果蓝色框起来的两个参数 当上面两组参数都相等时,则说明没有延迟。 方案三是对比 GTID 集合。首先我们在从库上执行 如下图所示: 如果 Executed_Gtid_Set 集合是包含 Retrieved_Gtid_Set,则表示从库接收到的日志已经同步完成。 比如上图中 前面一段是主库 id,后面一段 1-87383 是 GTID 范围。而 方案二对比位点和方案三的 GTID 比对都要比方案一的 小结:本篇通过 GTID 的方式更好地实现了主从节点的同步,以及如何观察主从同步的延迟。 参考资料: www.passjava.cn https://time.geekbang.org/column/article/77636 高性能 MySQL 第四版 千金良方:MySQL性能优化金字塔法则一、背景
双主模式
双主模式
改为了主从读写分离模式
。主库作为读写库,再加上一个从库用来做 I/O 密集型的任务(如大量的数据统计操作)。如下图所示:位点
的方式:指定 binlog 文件和 binlog 位置,这样从库就知道了复制的起始位置。(下文会讲解这种方式)
mixed
,从库同步时出现不一致的情况。
二、位点同步的痛点
2.1 通过位点同步的原理图
2.2 痛点
痛点1:首次开启主从复制的步骤复杂
痛点2:恢复主从复制的步骤复杂
三、GTID 方案
3.1 GTID 是什么?
c5d74746-d7ec-11ec-bf8f-0242ac110002:1
GTID=server_uuid:gno
3.2 GTID 的优势
3.3 如何启用 GTID
#GTID:
gtid_mode=on
enforce_gtid_consistency=onCHANGE MASTER TO
MASTER_HOST=$host_name
MASTER_PORT=$port
MASTER_USER=$user_name
MASTER_PASSWORD=$password
master_auto_position=1 3.4 GTID 同步方案
四、如何判断主从库是否有延迟
方案一:查看 seconds_behind_master
seconds_behind_master
参数的值,如下图所示,Seconds_Behind_Master 等于 0
方案二:对比位点
show slave status \G
命令后的结果:
Master_Log_File
和 Read_Master_Log_Pos
这两个参数合起来表示的是读到的主库的最新位点,第一参数是代表读取到了哪个文件,第二个是读取到的文件的位置。Relay_Master_Log_File
和 Exec_Master_Log_Pos
,这两个参数合起来表示的是从库执行的最新位点。Master_Log_File
和 Relay_Master_Log_File
相等,则说明从库读到的最新文件和主库上生成的文件相同,这里都是 mysql-bin.000934。Read_Master_Log_Pos
和 Exec_Master_Log_Pos
相等,则说明从库读到的日志文件的位置和从库上执行日志文件的位置相同,这里都是 59521082。方案三:对比 GTID 集合
show slave status \G
来查看 GTID 集合。
Master_UUID
表示当前连接的主库的 ID。Auto_Position
: 1 表示主备使用了 GTID 协议。Retrieved_Gtid_Set
表示从库收到的所有日志的 GTID 集合。Executed_Gtid_Set
表示从库已经执行完成的 GTID 集合。Retrieved_Gtid_Set
值为c5d74746-d7ec-11ec-bf8f-0242ac110002:1-87323
Executed_Gtid_Set
的值有两个集合7083ae1f-d7ef-11ec-a329-0242ac110002:1-2,
c5d74746-d7ec-11ec-bf8f-0242ac110002:1-87323Executed_Gtid_Set
的第二个集合和第一个集合完全一致,第一个集合 id 和 集合范围是上次同步另外一个主库的记录。这里说明从库已经和当前主库同步完成了。seconds_behind_master
更准确。但是还是没有达到精确的程度,需要配合半同步复制(semi-sync replication)才能达到。