数据库读写分离同步延时问题怎么解决

数据库读写分离是很多公司绕不过去的一个发展阶段,从单体数据库,到主备模式,再到读写分离,分库分表。每一个阶段都能为我们解决一些问题,但也带来了新的挑战。本篇文章我们就主要研究一下数据库读写分离及其带来的问题如何解决。

1数据库架构的发展历程

首先简单介绍一下数据库架构的发展历程,基本就是单体、主备、读写分离、分库分表,下面我们分别进行介绍。

1.1单体架构

业务发展初期,数据库的压力相对较小,这时候使用单独一个库就可以。

引出的问题:如果数据库出现故障,我们的业务就不能使用,只能说是停机重启修复故障。

1.2主备架构

由于单体带出的问题,这时候我们就需要加一个备用库,紧急情况可以用备库顶上,相当于加一个替补队员。

通过MySQL自带的主从同步机制,就可以放我们的替补队员上线。

当正式队员(主库)发生故障,我们就可以人工让其下线,让替补队员(备库)顶上。

引出的问题:随着业务大规模爆发,主库的压力过大,我们就想让备库承担起更大的责任来。

1.3读写分离架构

读写分离架构本质也就是主备架构,与主备架构没有本质区别,就是在主备架构的基础上,增加一层对读写请求的处理,使其能够更大程度上利用备用库为我们分担一些读的压力。

读写分离架构,需要在中间加一层控制读写请求的路由

1.4分库分表

分库分表的本质上是切分数据,是由于数据量级的提升,不对数据切分会严重影响数据库读写性能。

甚至是如果不切分,磁盘、内存、CPU无法承载这样的压力,数据库随时在崩溃的边缘。

分库分表与前三者是有本质区别的,分库分表后每一个库分片都可以采取以上三种方式的任意一种,可以是单体分片,也可以是主备分片,也可以是做了读写分离的分片。

分库分表和前三者中的一种是共生的关系。

2读写分离设计方案

主从复制是MySQL数据库自带的功能,但是想要做读写分离就需要我们自己做一些工作配合MySQL主从同步配合使用。可选择的方案有很多。

2.1代理

在应用程序和数据库之间增加代理层,代理层接收应用程序对数据库的请求,根据不同请求类型转发到不同的实例,实现读写分离的同时还可以实现负载均衡(读请求按照负载均衡的规则传入各个从节点)。

代理也就是借助中间件的方式,控制不同类型请求,进入不同的数据库。

目前常用的mysql的读写分离中间件有:

MySQL-Proxy

MySQL自己的一个开源项目,通过其自带的Lua脚本进行SQL判断

Atlas

Qihoo,在mysql-proxy0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。

MyCat

MaxScale

MariaDB开发

Amoeba

阿里开发

2.2应用内路由

在程序中进行控制,我们利用持久层框架的拦截器实现,动态路由不同数据源。

利用Sharding-JDBC也可以实现

实现思路:

配置多数据源

设置默认的数据源,配置数据源的切换策略

拦截进入数据库的请求,根据业务需求设置走哪个数据源。

3读写分离造成的读延迟怎么办?

凡是采用读写分离架构,就会有同步延迟问题,我们只能想办法去克服这个问题。

3.1数据同步写入从库

主从复制模式,一般都是异步写数据到从库,当然这个异步也可以设置为同步,只有当从库写完成,主库上的写请求才能返回。

这种方案是最佳单也是最有效的一种,但也是性能最差的一种,尤其是有大量从库的情况下,严重影响请求效率。

3.2缓存(中间件)路由法

写请求时缓存记录一个key,这个key的失效时间设置为主从同步的延时,读请求的时候先去缓存中确认是否存在key,如果key存在说明发生了写请求,数据未同步到从库,这时走主库即可,若不存在这个key,直接走从库的查询即可。

中间件应该也是可以判断是否同步完成,与使用缓存记录类似。

这种方案最大的弊端是引入了缓存,系统复杂度上升。

3.3选择性强制读主库

对于一些特殊的业务场景,采用强制读主库。

弊端,需要把每一个这种情况都找出来,设置成强制走主库。

3.4等GTID方案

MySQL在执行完事务后,会将该事务的GTID会给客户端,然后客户端可以使用该命令去要执行读操作的从库中执行,等待该GTID,等待成功后,再执行读操作;如果等待超时,则去主库执行读操作,或者再换一个从库执行上述流程。

MariaDB的MaxScale就是使用该方案,MaxScale是MariaDB开发的一个数据库智能代理服务(也支持MySQL),允许根据数据库SQL语句将请求转向目标一个到多个服务器,可设定各种复杂程度的转向规则。

3.5以不变应万变

有延迟就有延迟,对数据强一致性要求不高的场景可以放任不管。




转载请注明:http://www.aierlanlan.com/cyrz/2346.html