所在的位置： mysql >> mysql优势 >> 阿里云RDS深度定制XACrashSa

阿里云RDS深度定制XACrashSa

北京荨麻疹医院电话 http://m.39.net/pf/a_9204186.html

一、阿里云RDSMySQL（AliSQL）

AliSQL是MySQL的分支，阿里在这个分支上做了很多深度的定制，以充分挖掘MySQL的潜力。AliSQL支撑了阿里集团电商业务十余年，其稳定性、安全性和高性能是经过了极其严苛实践检验的。除此之外，AliSQL做了很多实用性的功能，以提高MySQL的易用性和使用效率。下图是AliSQL上重要的功能的列表。

二、RDS定制化功能介绍

1.实用性：SQLOutline在线固化SQL执行计划

我们使用MySQL的时候时常会碰到一种情况，即业务跑着的时候有个SQL执行会变慢，分析之后发现是这个SQL执行计划发生了变化。这种变化有很多原因，比如bug或是版本升级了等等。

MySQL就提供了hint功能，它可以使我们在SQL语句里增加一些提示，以保证SQL在生成执行计划的时候是按照提示来工作的。但这只是比较理想化的状态，实际情况中这样是很不方便的，因为业务已经在线上运行了，这个时候即使能够改变业务的SQL，也需要一个很漫长的时间和过程。

为了解决这个问题，就有了SQLOutline的功能。这个功能不需要改变应用的SQL语句，只需要在server端告诉RDS碰到哪种类型的特定的SQL，可以给它定制一个hint，然后按照用户指定的方式执行。

2.实用性：PerformanceAgent可诊断、可度量

我们在实例的监控上也做了大量的工作，从而可以很容易的分析数据库中的一些问题。首先就是实例级别的统计信息，它包括了操作系统层面、server层和InnoDB等共计55个指标。然后把它放到一个Performance表中，每秒钟进行一次统计。通过这些统计的信息可以分析系统出现问题的原因。

3.实用性：PerformanceInsight可诊断、可度量

这个是对象级别性能度量的指标，包括表和索引。这些统计可以支持业务数据模型的优化和变更。

还有语句级别的统计信息。MySQL本身具有语句级别统计信息，但是它的统计信息不够丰富，因此在这个基础上我们又增加了更多实用性的统计信息，比如CPU的使用时间，加锁消耗的时间等。

MySQL里用了大量的Mutex来保证多线程之间的数据访问，我们加了对于Mutex加锁时消耗时间的统计，方便对数据库热点的分析。

这些统计信息提供了更充分的数据依据，帮助我们做快速的问题定位。

4.稳定性：BufferPool优化

在稳定性方面，我们也做了大量的工作。首先是BufferPool的优化。

云上用户会有临时变配的需求。举个例子，在业务高峰时，若希望实例临时规格变大，过了高峰之后再把规格降下来。MySQL是支持线上的resize，但是它的稳定性不够好。在做Onlineresize对性能的影响还是比较大的。AliSQL针对这个做了优化后，可以看到下图蓝色线条是动态变配的波动曲线，稳定性好很多。

5.稳定性：ConcurrencyControl并发控制

用户常常会碰到几个SQL过来一下子就把实例的CPU打满的情况，或者是内存耗光等类似的情况。ConcurrencyControl并发控制这个功能，可以让用户根据实际使用情况，对SQL限制执行个数，以提高实例整体运行的稳定性。

6.安全性：TDE支持国密SM4

企业级用户对于安全性的要求越来越高，对于各种各样的加密、密码强度、生命周期等要求也越来越多。AliSQL在安全这块做了更全面的支持，比如对于加密来讲，除了支持TDE这种AES的加密算法，还支持国密加密算法SM4，对于有涉密要求的用户可以用SM4的加密算法来保证数据的安全性。

7.安全性：RecycleBin防止误删除

当用户在做删除表或是Truncate表的时候，使用这个回收站功能，并不会把数据文件直接删除掉，而是会把这些表放到一个回收站里，这样就避免了用户在误删之后数据丢失的风险，误删除后还能通过回收站把删除的数据快速找回。

8.安全性：FlashbackQuery

不仅是表级的误删除，当我们对某一些数据更新的范围错误了之后，使用Flashback机制，可以恢复到更新前的历史版本。同时，用户还可以自定义查询某个时间戳的某个数据。

所以FlashbackQuery对误操作删除恢复或是回档需求是很有效的方法。

9.高性能：BinlogInRedo

对比原生MySQL，AliSQL的性能提升很多。首先介绍的是BinlogInRedo功能。众所周知，在MySQL里面，事务提交的时候需要持久化两次，因为要执行两阶段的事务提交过程。这里面做了一个改进，即可以把Binlog写到Redo里面，这样的话就只需要持久化一次Redolog，Binlog可以异步刷盘。

通过这种方式，用户事务在提交的时候就只需要一次刷盘动作，因此时延会降低，吞吐量会增大。

上图是基于两个BinloginRedo版本的测试结果。通过左侧第二个版本的数据，我们发现性能会提高很多。对于Updatenonindex来讲，可以有大概38%的性能提升。对于writeonly来讲，也可以达到25%的性能提升。

10.高性能：FastQueryCache

AliSQL针对QueryCache在并发控制、内存管理和缓存机制等等做了大量的优化。

优化之后，它的性能提升非常明显。在pointselect的场景下，性能提升甚至可以达到%以上。通过测试发现，在rewrite模式命中率比较低的情况下，几乎没有任何性能损失。所以用户在读比较多的场景就可以把QueryCache打开，可以保持稳定高效的状态。

11.高性能：DDLOptimization

围绕DDL我们做了大量优化。

用户在使用DDL的时候会发现，如果表特别大需要做rebuild或更新数据等操作的时候，效率非常低。主要是因为DDL利用BufferPool的模型是效率低下的模型。优化之后，对于rebuild表的这种操作效率会高很多，对于其他SQL语句的影响也会降低很多。

下图是针对CreateIndex和OptimizeTable的测试，可以看到优化之后，操作都会有10倍以上的性能提升。

三、XACrashSafe介绍

1.XACrashSafe背景

抛开XACrashSafe本身，MySQL本身也有CrashSafe机制。为什么会需要这样的机制呢，因为在MySQL里，同时包括Binlog和数据两个部分，可以理解为存了两份一模一样的数据。为了保证这两份数据的一致性，MySQLCrashSafe实现了两阶段提交机制。为了保证Binlog和数据的一致性，任何用户的事务都会被转化成为两阶段的事务，首先就是进行prepare，然后再写Binlog并持久化，最后做事务的提交。所以在这两个阶段的提交过程中，Prepare、刷Redo、写Binlog和刷Binlog的执行顺序是保持不变的。

如何保证CrashSafe呢？这要看它恢复的处理过程。在实际的事务执行过程中，只要是Binlog有这个事务，一定是Prepare的状态。那么利用这个原则，在MySQLCrash重启的时候，它会取出所有已经prepare的事务，把它们的XID取出来，扫描最后一个Binlog文件，然后确认XID所对应的事务是否已经存储到Binlog里了。如果已经存储过了，就直接提交即可；如果还没有存储，就回滚掉。通过这个CrashRecovery机制后，Binlog里的数据就和引擎里面的数据保持一致了。

对于普通用户事务可以用两阶段来保证CrashSafe，那么对于用户的XA事务怎么处理呢？

在Binlog里会把这个事务分为独立的两部分，当用户执行XAPrepare的时候，会写Binlog文件，然后把这个Prepare状态执行到引擎里，这是完全独立的。用户在XACommit里，可以在任何时间执行，当用户在执行XACommit之后会被再记录一次Binlog，所以这两者是完全脱离的。

对于普通的用户事务，执行过程只记录一次Binlog，而且整个事务是一个基本的单元存在Binlog中的；对于XA事务，这就是分开的。而且它整个过程是先写Binlog，然后才去把状态持久化到引擎中，做引擎的prepare。对于MySQL来讲，不能保证外部XA事务数据和Binlog的一致性。

也就是说当写完Binlog，还没有在引擎中执行prepare和

转载请注明：http://www.aierlanlan.com/grrz/2521.html

上一篇文章： MySQL专栏详解数据库创建查看和

下一篇文章： MySQL数据库字符集修改ALTERD