MySQL优化之前,要先了解MySQL的查询过程,很多喜查询优化工作实际上就是遵循一些原则,让MySQL的优化器能够按照预想的合理方式运行而已。
一、优化优化有风险,涉足需谨慎。
优化可能带来的问题?优化不总是对一个单纯的环境进行,还很可能是一个复杂的已投产的系统;优化手段本来就有很大的风险,只不过你没能力意识到和预见到;任何的技术可以解决一个问题,但必然存在带来一个问题的风险;对于优化来说解决问题而带来的问题,控制在可接受的范围内才是有成果;保持现状或出现更差的情况都是失败!
优化的需求?稳定性和业务可持续性,通常比性能更重要;
优化不可避免涉及到变更,变更就有风险;
优化使性能变好,维持和变差是等概率事件;
切记优化,应该是各部门协同,共同参与的工作,任何单一部门都不能对数据库进行优化!
所以优化工作,是由业务需要驱使的!
优化由谁参与?在进行数据库优化时,应由数据库管理员、业务部门代表、应用程序架构师、应用程序设计人员、应用程序开发人员、硬件及系统管理员、存储管理员等,业务相关人员共同参与。
二、优化思路优化什么?在数据库优化上有两个主要方面:即安全与性能。
安全-数据可持续性;
性能-数据的高性能访问。
优化的范围有哪些?存储、主机和操作系统方面:
主机架构稳定性;
I/O规划及配置;
Swap交换分区;
OS内核参数和网络问题。
应用程序方面:
应用程序稳定性;
SQL语句性能;
串行访问资源;
性能欠佳会话管理;
这个应用适不适合用MySQL。
数据库优化方面:
内存;
数据库结构(物理逻辑);
实例配置
说明:不管是设计系统、定位问题还是优化,都可以按照这个顺序执行。
c优化维度?数据库优化维度有四个:硬件、系统配置、数据库表结构、SQL及索引。
优化选择:
优化成本:硬件系统配置数据库表结构SQL及索引。
优化效果:硬件系统配置数据库表结构SQL及索引。
三、数据库服务器的优化步骤当我们遇到数据库调优问题的时候,该如何思考呢?我把思考的流程整理成了下面这张图。
整个流程划分成了观察(Showstatus)和行动(Action)两个部分。字母S的部分代表观察(会使用相应的分析工具),字母A代表的部分是行动(对应分析可以采取的行动)
通过观察了解数据库整体的运行状态,通过性能分析工具可以让我们了解执行慢的SQL都有哪些,查看具体的SQL执行计划,甚至是SQL执行中的每一步的成本代价,这样才能定位问题所在,找到了问题,再采取相应的行动
详细解释一下这张图首先在S1部分,我们需要观察服务器的状态是否存在周期性的波动。如果存在周期性波动,有可能是周期性节点的原因,比如双十一、促销活动等。这样的话,我们可以通过A1这一步骤解决,也就是加缓存,或者更改缓存失效策略
如果缓存策略没有解决,或者不是周期性波动的原因,我们就需要进一步分析查询延迟和卡顿的原因。接下来进入S2这一步,我们需要开启慢查询。慢查询可以帮我们定位执行慢的SQL语句。我们可以通过设置long_query_time参数定义“慢”的阈值,如果SQL执行时间超过了long_query_time,则会认为是慢查询。当收集上来这些慢查询之后,我们就可以通过分析工具对慢查询日志进行分析
在S这一步骤中,我们就知道了执行慢的SQL语句,这样就可以针对性地用EXPLAIN查看对应SQL语句的执行计划,或者使用SHOWPROFILE查看SQL中每一个步骤的时间成本。这样我们就可以了解SQL查询慢是因为执行时间长,还是等待时间长
如果是SQL等待时间长,我们进入A2步骤。在这一步骤中,我们可以调优服务器的参数,比如适当增加数据库缓冲池等。如果是SQL执行时间长,就进入A步骤,这一步中我们需要考虑是索引设计的问题?还是查询关联的数据表过多?还是因为数据表的字段设计问题导致了这一现象。然后在这些维度上进行对应的调整
如果A2和A都不能解决问题,我们需要考虑数据库自身的SQL查询性能是否已经达到了瓶颈,如果确认没有达到性能瓶颈,就需要重新检查,重复以上的步骤。如果已经达到了性能瓶颈,进入A4阶段,需要考虑增加服务器,采用读写分离的架构,或者考虑对数据库分库分表,比如垂直分库、垂直分表和水平分表等
以上就是数据库调优的流程思路。当我们发现执行SQL时存在不规则延迟或卡顿的时候,就可以采用分析工具帮我们定位有问题的SQL,这三种分析工具你可以理解是SQL调优的三个步骤:慢查询、EXPLAIN和SHOWPROFILE
从步骤上看,我们需要先进行观察和分析,分析工具的使用在日常工作中还是很重要的。今天只介绍了常用的三种分析工具,实际上可以使用的分析工具还有很多。
这里总结一下文章里提到的三种分析工具。我们可以通过慢查询日志定位执行慢的SQL,然后通过EXPLAIN分析该SQL语句是否使用到了索引,以及具体的数据表访问方式是怎样的。我们也可以使用SHOWPROFILE进一步了解SQL每一步的执行时间,包括I/O和CPU等资源的使用情况。