为什么主从延时这么大?
答:MySQL使用单线程重放RelayLog。
应该怎么优化,缩短重放时间?
答:多线程并行重放RelayLog可以缩短时间。
多线程并行重放RelayLog有什么问题?答:需要考虑如何分割RelayLog,才能够让多个数据库实例,多个线程并行重放RelayLog,不会出现不一致。
为什么会出现不一致?
答:如果RelayLog随机的分配给不同的重放线程,假设RelayLog中有这样三条串行的修改记录:
updateaccountsetmoney=whereuid=58;
updateaccountsetmoney=whereuid=58;
updateaccountsetmoney=00whereuid=58;
如果单线程串行重放:能保证所有从库与主库的执行序列一致。
画外音:最后money都将为00。
如果多线程随机分配重放:多重放线程并发执行这3个语句,谁最后执行是不确定的,最终从库数据可能与主库不同。
画外音:多个从库可能money为,,00不确定。
如何分配,多个从库多线程重放,也能得到一致的数据呢?
答:相同库上的写操作,用相同的线程来重放RelayLog;不同库上的写操作,可以并发用多个线程并发来重放RelayLog。
如何做到呢?
答:设计一个哈希算法,hash(db-name)%thread-num,库名hash之后再模上线程数,就能很轻易做到,同一个库上的写操作,被同一个重放线程串行执行。
画外音:不同库上的重放,是并行的,就起到了加速做用。
这个方案有什么不足?
答:很多公司对MySQL的使用是“单库多表”,如果是这样的话,仍然只有一个库,还是不能提高RelayLog的重放速度。
启示:将“单库多表”的DB架构模式升级为“多库多表”的DB架构模式。
画外音:数据量大并发量大的互联网业务场景,“多库”模式还具备着其他很多优势,例如:
(1)非常方便的实例扩展:DBA很容易将不同的库扩展到不同的实例上;
()按照业务进行库隔离:业务解耦,进行业务隔离,减少耦合与相互影响;
(3)非常方便微服务拆分:每个服务拥有自己的实例就方便了;
“单库多表”的场景,多线程并行重放RelayLog还能怎么优化?
答:即使只有一个库,事务在主库上也是并发执行的,既然在主库上可以并行执行,在从库上也应该能够并行执行呀?
新思路:将主库上同时并行执行的事务,分为一组,编一个号,这些事务在从库上的回放可以并行执行(事务在主库上的执行都进入到prepare阶段,说明事务之间没有冲突,否则就不可能提交),没错,MySQL正是这么做的。
解法:基于GTID的并行复制。
从MySQL5.7开始,将组提交的信息存放在GTID中,使用mysqlbinlog工具,可以看到组提交内部的信息:
:5server_id58XXXGTIDlast_