随着用户对数据访问速度的日益重视,MySQL数据库在最初的设计中,采用了线性预读的方式,提前将即将使用的数据预读到Bufferpool中,来提升数据的访问速度,但在实际使用过程中,线性预读失效的问题愈来愈突出。对于存在时间比较长,变更又比较频繁,除非我们对于这张表进行重建,否则该表会存在大量的数据碎片,导致数据存放不连续,这样会使MySQL原有的线性预读功能失效,导致某些查询语句变很慢,如:全表扫描,范围扫描等。频繁变更操作会破坏数据的连续性一般情况下,当我们在数据存放连续时执行全表扫描,数据库就会异步地把这些数据从磁盘加载到Bufferpool,从而提高数据库的处理速度。比如当我们访问了RowA1,RowA2,RowA3时,数据库会认为你下次有极大的概率去访问RowA4,RowA5,RowA6,从而自动异步地把这些数据加载到Bufferpool中。但如果在这张表上频繁地执行变更操作,则会破坏数据的连续性。在我们访问RowA1,RowA2,RowA3时,数据库发现这三行数据并不连续,所以数据库不会提前将RowA5,RowA6从磁盘异步地加载到Bufferpool,只能一个一个的去请求、加载,从而影响访问效率。数据连续时,访问wRow数据需要12s,但是数据不连续时,访问wRow数据需要34s。对于在线应用来说,重建表会产生较大的运维风险,数据面临丢失的可能。那到底有没有什么特性可以在不重建表的情况下,弥补线性预读失效的问题呢?线性预读的失效催生出“逻辑预读”特性华为云RDS数据库服务,新开发了“逻辑预读”特性,在不重建表的情况下,弥补线性预读失效的问题,从而提高分析型业务的执行效率。“逻辑预读”特性,在预读数据的时候,首先通过对要预读的数据的页号进行排序,去除数据不连续的影响,然后合并相邻数据页的IO请求,减少磁盘IO的总请求次数,从而提高数据预读的命中率和效率。华为云数据库团队做了一个测试:采用8核16GBGBSSD规格的Linux机器,测试2.4GB大小wRows存在碎片的数据,执行select*fromtablename(全表扫描查询),结果如下:由此可见,相比开源版本,华为云MySQL逻辑预读特性大大缩短了访问时长,极大提升了执行效率,为分析型业务的进一步发展注入了新动力。每一个改变都是为了更好的服务客户,华为云MySQL逻辑预读特性的推出,不仅很好地弥补了线性预读的失效问题,提升了分析型业务的执行效率,更是为客户的业务场景保驾护航,助力其创新发展,实现更多价值。更多详情了解,敬请前往华为云
转载请注明:http://www.aierlanlan.com/rzfs/6246.html