如果是做数据分析,MySQL里面最重要、最常用的就是数据查询,数据查询不只是简单查询数据库中存储的数据,还要根据需求对数据进行筛选、聚合,以及确定数据以什么样的格式进行显示。MySQL提供了强大、灵活的语句和函数来实现查询的操作。下面是几篇都是涉及数据查询的介绍,包括基本的SELECT语句、单表查询、多表查询、使用集合函数、连接查询、子查询和使用正则表达式等等。
MySQL中,使用频率最高、最重要的语句是SELECT语句。
语法格式如下↓
SELECT{*
字段列名}[FROM表1,表2…[WHERE表达式[GROUPBYgroupbydefinition[HAVINGexpression[{operatorexpression}…]][ORDERBYorderbydefinition][LIMIT[offset,]rowcount]]
{*
字段列名}包含星号通配符的字段列表,表示所要查询字段的名称。
表1,表2…,表1和表2表示查询数据的来源,可以是单个或多个。WHERE表达式是可选项,如果选择该项,将限定查询数据必须满足该查询条件。GROUPBY字段,该子句告诉MySQL如何显示查询出来的数据,并按照指定的字段分组。[ORDERBY字段],该子句告诉MySQL按什么样的顺序显示查询出来的数据,可以进行的排序有升序(ASC)和降序(DESC),默认情况下是升序。[LIMIT[offset,]rowcount],该子句告诉MySQL每次显示查询出来的数据条数。下面先简单介绍全表查询、指定字段查询、设置字段别名和使用LIMIT关键字限制查询行数。其他内容后面慢慢介绍。查询的表格是order订单表,数据是模拟的数据,可以通过PowerBI开场白那篇最后去下载文件,字段如下,按订单号顺序排列。
MySQL中,查询全表所有数据,使用"*"通配符查询最方便简洁,但如果不知道表数据量的情况下,不建议使用全量查询,可能会死掉。最好借用LIMIT语句限制一下数量。下面是查询order表全量数据的SQL语句↓
SELECT*FROMsql_study.order
一般情况下表里面会有很多用不上的字段,就可以通过选择指定的字段进行查询。下面只查询订单号、用户id、日期和数量,SQL语句如下↓
SELECT订单号,用户id,日期,数量FROMsql_study.order
大部分的数据表字段名称都是英文命名,对我们来说看起来很不友好,所有选择字段的时候需要去一个我们熟悉的别名。AS关键字用来设置别名,可以省略,省略后需要将表名和别名用空格隔开。
下面把订单号设置order_no、用户id设置user_id、日期设置date、数量设置amount,SQL语句如下↓
SELECT订单号ASorder_no,用户idASuser_id,日期ASdate,数量ASamountFROMsql_study.order
当数据表中有上万条数据时,一次性查询出表中的全部数据会降低数据返回的速度,同时给数据库服务器造成很大的压力。这时就可以用LIMIT关键字来限制查询结果返回的条数。
LIMIT是MySQL中的一个特殊关键字,用于指定查询结果从哪条记录开始显示,一共显示多少条记录。
LIMIT关键字有3种使用方式,即指定初始位置、不指定初始位置以及与OFFSET组合使用。
指定初始位置
LIMIT初始位置,记录数
初始位置:表示从哪条记录开始显示;
记录数:表示显示记录的条数。第一条记录的位置是0,第二条记录的位置是1。后面的记录依次类推。在order表中,使用LIMIT语句,返回从第四行开始,去5条记录。SQL语句如下↓
SELECT*FROMsql_study.orderLIMIT3,5
不指定初始位置
默认从第一条开始,然后取限定的条数,下面取5条记录,SQL语句如下,可以从结果看到,订单号是从1号开始的。
SELECT*FROMsql_study.orderLIMIT5
LIMIT和OFFSET组合使用
语法格式如下↓
LIMIT记录数OFFSET初始位置
初始位置:指定从哪条记录开始显示;
记录数:表示显示记录的条数。实现第一种方式,返回从第四行开始,去5条记录。SQL语句如下↓
SELECT*FROMsql_study.orderLIMIT5OFFSET3
End