今天继续MySQL的问题,也是一个常见的问题,就是计算同比和环比问题,然后在此思路的基础上做一个复合增长率的计算。在MySQL8.0之前,同比环比的思路是通过LEFTJOIN去把上一期的数据求出来,然后再进行计算。再MySQL8.0之后,计算方式就很简单了,通过窗口函数可以很简单的解决,所以今天介绍的是窗口函数的解决方案。
首先是数据的准备,数据如下,我们准备了从-三年每天三个产品的交易数据,这里就只把最关键的几个字段给留出来了↓
环比、同比一般是计算月度的,所以我们第一步需要先把数据转换成月维度的数据,这里只需要用到最基础的SQL操作,GROUPBY一下就行了,SQL语句和结果如下↓
SELECT
product,
DATE_FORMAT(s_date,"%Y-%m")ASym,
SUM(amount)ASamount,
SUM(gmv)ASgmv
FROM
orders
GROUPBY
product,ym
这样我们就得到了每个产品每个月的金额和数量了,而且我们这里是按照产品、月份排序的。然后先计算环比,我们就用数量进行举例了,金额是一个道理。思路是我们需要找到当前月份上一个月的销售数量,使用窗口函数的LAG函数,进行一次偏移就行了。就可以得到上月的金额,然后还需要按产品进行分组,也就是OVER里面的PARTIONBY产品,然后通过环比的公式计算一下就行了,SQL语句个结果如下↓
WITHcteAS(
SELECT
product,
DATE_FORMAT(s_date,"%Y-%m")ASym,
SUM(amount)ASamount,
SUM(gmv)ASgmv
FROM
orders
GROUPBY
product,ym
ORDERBY
product,ym)
SELECT
product,ym,amount,
LAG(amount,1)OVER(PARTITIONBYproductORDERBYym)ASlm_amount,
CONCAT(ROUND((amount-LAG(amount,1)OVER(PARTITIONBYproductORDERBYym))/
LAG(amount,1)OVER(PARTITIONBYproductORDERBYym),2),"%")ASMoM_amount
FROM
cte
这里简单介绍一下,同比和环比的公式↓
环比=(本月值-上月值)/上月值,或者本月值/上月值-1
同比=(本月值-上年同期值)/上年同期值,或者本月值/上年同期值-1
然后就是同比,思路和环比一样的,只是偏移的月份从1变成了12,SQL语句和结果如下↓
WITHcteAS(
SELECT
product,
DATE_FORMAT(s_date,"%Y-%m")ASym,
SUM(amount)ASamount,
SUM(gmv)ASgmv
FROM
orders
GROUPBY
product,ym
ORDERBY
product,ym)
SELECT
product,ym,amount,
LAG(amount,12)OVER(PARTITIONBYproductORDERBYym)ASly_amount,
CONCAT(ROUND((amount-LAG(amount,12)OVER(PARTITIONBYproductORDERBYym))/
LAG(amount,12)OVER(PARTITIONBYproductORDERBYym),2),"%")ASYoY_amount
FROM
cte
最后是一个巩固练习,使用窗口函数计算复合增长率。先介绍一下复合增长率的公式,就是使用本期的数据除以第一期的数据,然后根据间隔开方,再减一,公式如下↓
CAGR=(EndingValue/BeginningValue)^(1/N)-1
所以我们需要计算两个值,第一个是首期的值,第二个是间隔的期数。两个值都是用窗口函数来计算的,首期使用FIRST_VALUE计算,间隔就用ROW_NUMBER。最后使用我们上面的公司就能计算出复合增长率了,SQL语句和结果如下↓
WITHcte2AS(
WITHcteAS(
SELECT
product,
DATE_FORMAT(s_date,"%Y-%m")ASym,
SUM(amount)ASamount,
SUM(gmv)ASgmv
FROM
orders
GROUPBY
product,ym
ORDERBY
product,ym)
SELECT
product,ym,amount,gmv,
FIRST_VALUE(amount)OVER(PARTITIONBYproductORDERBYym)ASfirst_amount,
ROW_NUMBER()OVER(PARTITIONBYproductORDERBYym)asrn
FROM
cte)
SELECT
product,ym,amount,first_amount,rn,
CONCAT(ROUND((POWER(1.0*amount/first_amount,1.0/NULLIF(rn-1,0))-1)*,2),"%")AS"月均复合增长率"
FROM
cte2
到此,我们几种对比的方式已经都实现了,都是使用月的维度进行演示的,使用日、周、年维度都是相同的思路,只要把顺序排列好就行了。
End