作为一个数据分析师,经常要和数据打交道,而数据存储在数据库中,所以掌握一些数据库知识是很有必要的。
认识数据库
数据库有很多种类型,常见的数据库有MySQL、Oracle和SQLServer等,这些都属于关系型数据库,所谓关系型数据库是指数据库中的数据都是二维表格模型,就像Excel表格一样,由行列组成,每一行表示一条记录,每一列表示一个字段,例如数据库中一个学员的信息记录表,格式如下。
常见的关系型数据库有以下一些,如下图所示。
其中,
MySQL:由瑞典MySQLAB公司开发,目前属于属于Oracle旗下。
Oracle:Oracle公司的产品,甲骨文公司。
SQLServer:微软公司开发的数据库。
MariaDB:MySQL的一个分支,主要由开源社区在维护,由MySQL之父Widenius创立。
SQLite:一款轻型的数据库,多用于嵌入式产品中。
非关系型数据库,即NoSQL,NotOnlySQL,意为不仅仅是SQL,常见的就是MongoDB,MongoDB一个基于分布式文件存储的数据库,以键值来存储数据,结构不固定,每一条记录都可以有不一样的字段,这种就不会局限于固定的结构。
常见的非关系型数据库有以下一些,如下图所示。
其中,
mongoDB:一个基于分布式文件存储的数据库,以键值来存储数据,结构不固定。
redis:RemoteDictionaryServer,即远程字典服务,一个高性能的key-value数据库。
HBase:Hadoop的数据库,是一个基于列的适合于非结构化数据存储的数据库。
Hive:一个基于Hadoop的数据仓库工具,用类SQL语句访问存储在Hadoop系统中的数据。
Cassandra:一套开源分布式NoSQL数据库系统,最初由Facebook开发,用于储存收件箱等简单格式数据。
作为初学者,推荐大家学习MySQL数据库,原因有以下三点。
使用广泛,很多公司都使用MySQL数据库,包括国内很多大型互联网公司。
入门简单,从简单的地方开始学习,有助于增加我们学习的信心。
学好了MySQL,再去学其他数据库都是类似的、相通的。
安装MySQL数据库
MySQL的安装主要有两种以下方式。
一种是通过图形化的界面安装,就是下载MySQL的安装包,双击运行后,直接下一步、下一步即可;
另外一种是通过命令行安装,就是下载MySQL的压缩文件,解压后,再通过命令行对MySQL进行配置。
这里,推荐大家用第一种安装方式,简单易学。
在Windows下,我们可以通过MySQLInstaller来安装MySQL。
通过MySQLInstaller安装三个东西:
MySQLServer:MySQL服务器
MySQLWorkbench:写SQL代码的工具。
MySQLNotifier:监视器,用于启动、重启MySQLServer。
第一步:下载并安装MySQLInstaller
去MySQL