上篇文章分析了MySQL主从同步的配置,傻瓜式的配置还是相对容易的。知道怎么配,还需要知道这么配的运行原理。也就是我们常说的知其然,知其所以然。
一、原理分析
主从同步也叫主从复制。同步原理
0、主服务器(master)把数据更改记录到二进制日志(binlog)中。
1、从服务器(slave)连接主服务器,master会为每个slave开启单独的binlog dump thread。
mysql>change master to master_host='10.235.25.242',master_user='mysql',master_password='123456',master_log_file='mysql-bin.000147',master_log_pos=98;
2、从库上启动I/O线程和SQL线程。
mysql>start slave;
3、master上的binlog dump thread发送binlog, slave上的I/O线程接收binlog后写入中继日志(relay log)。【这里master和slave建立的是TCP连接,很多资料表明是binlog dump thread发送到slave, slave I/O线程读取,我理解一端发送,一段接收】
4、slave上的SQL线程读取relay log, 写入从库。
三、查看主从的状态
0、查看主库的状态
mysql> show master status\G *************************** 1. row *************************** File: mysql-bin.000152 Position: 2597 Binlog_Do_DB: niliu Binlog_Ignore_DB: 1 row in set (0.00 sec)
1、查看从库的状态
mysql> show slave status\G *************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 10.235.25.242 Master_User: mysql Master_Port: 3306 Connect_Retry: 60 Master_Log_File: mysql-bin.000152 Read_Master_Log_Pos: 2597 Relay_Log_File: dev241-relay-bin.004238 Relay_Log_Pos: 235 Relay_Master_Log_File: mysql-bin.000152 Slave_IO_Running: Yes Slave_SQL_Running: Yes Replicate_Do_DB: niliu Replicate_Ignore_DB: Replicate_Do_Table: Replicate_Ignore_Table: Replicate_Wild_Do_Table: Replicate_Wild_Ignore_Table: Last_Errno: 0 Last_Error: Skip_Counter: 0 Exec_Master_Log_Pos: 2597 Relay_Log_Space: 235 Until_Condition: None Until_Log_File: Until_Log_Pos: 0 Master_SSL_Allowed: No Master_SSL_CA_File: Master_SSL_CA_Path: Master_SSL_Cert: Master_SSL_Cipher: Master_SSL_Key: Seconds_Behind_Master: 0 1 row in set (0.00 sec)
四、查看主从上的线程
0、查看主库上的线程
可以看到ID为11415的线程就是binlog dump thread
mysql> show processlist\G *************************** 1. row *************************** Id: 9126 User: root Host: 10.222.76.238:54299 db: NULL Command: Sleep Time: 54 State: Info: NULL *************************** 2. row *************************** Id: 11288 User: root Host: 10.235.25.242:35012 db: NULL Command: Query Time: 0 State: NULL Info: show processlist *************************** 3. row *************************** Id: 11415 User: mysql Host: 10.235.25.241:42098 db: NULL Command: Binlog Dump Time: 9 State: Has sent all binlog to slave; waiting for binlog to be updated Info: NULL
1、查看从库上的线程
可以看到ID为2的线程就是I/O线程,ID为3的线程就是SQL线程。
mysql> show processlist\G *************************** 1. row *************************** Id: 6 User: root Host: dev241:36096 db: NULL Command: Query Time: 0 State: NULL Info: show processlist *************************** 2. row *************************** Id: 7 User: system user Host: db: NULL Command: Connect Time: 860 State: Waiting for master to send event Info: NULL *************************** 3. row *************************** Id: 8 User: system user Host: db: NULL Command: Connect Time: 18 State: Has read all relay log; waiting for the slave I/O thread to update it Info: NULL 3 rows in set (0.00 sec)
五、主从延迟
思考主从延迟,一般业务延迟多久可以接受。
MySQL 技术内幕:主从同步和主从延时
六、故障汇总
0、线上业务两次同样的请求,返回的数据不一致。
分析:该业务为一主两从的模式,可见是两次读从库数据不一致,说明两个从库不同步。
原因:一个从库SQL Thread和I/O Thread都停了。【进一步原因待分析】
解决:手动临时下线故障从库。恢复故障从库的线程,手动上线。
思考:考虑主从延迟多久 ,业务可以承受(比如1s)。加个自动下线从库逻辑,超过多长时间,延迟从库从域名下线。
参考:
Mysql主从同步的原理
《高性能MySQL》
《深入理解MySQL Innodb引擎内幕》
MySQL 主从同步(5)-同步延迟状态考量(seconds_behind_master和pt-heartbea)MySQL 主从同步(3)-percona-toolkit工具(数据一致性监测、延迟监控)使用梳理