作为IT界的一份子,“数据库”这个词一定是不陌生的,无论你在什么岗位。数据库是一款被很多人忽略的IT软件产品,事实上它的重要性不言而喻,丝毫不亚于芯片、操作系统。没有数据库的企业,相当于没有根的树。
和很多软件产品一样,数据库最早是国外进步的产物,20世纪60年代国外就有了商业数据库,但直到80年代国内才拥有第一批成型的数据库人才。
那么在国内互联网井喷式发展的情况下,在数据库方面,中国已经到达怎样的发展程度?中国的数据库历史是怎样的发展脉络?如今面临的问题又是什么?
今年5月甲骨文中华区大规模的裁员,就是中国跨过数据库这座大山造成的局部“山体滑坡”。
在09年以前,甲骨文Oracle可以说是世界数据库的强者,占据着绝对的霸主地位。但是放在10年后,在年就已经被崛起的云数据库打击的得靠强制裁员来转型。中国市场虽然大,但是本地的云数据库已经比从前强太多,竞争优势已经不复存在。
在亚马逊re:Invent大会上,CEOAndyJassy曾调侃,曾经的王者甲骨文,现在在全球云计算市场份额太低,不算真正的对手。亚马逊真正需要注意的对手是微软、阿里巴巴和谷歌。
数据库,其实是一项经常被人忽略、但实际上相当重要的软件,可以这么说,如果没有数据库,就没有国计民生。
谈起中国数据库的发展,离不开研究的引路人——萨师煊。如果没有他,数据库的星火燎原也就不会发生。
中国数据库的诞生(——)
业界对于数据库理论正式传入国内有一个共识:年恢复高考后,无数人回归了大学校园。萨师煊老师当着他们的面,在黑板上写下了“数据库”3个字。
数据库在中国的研究和科普就这么被启蒙了。
我国最早的数据库学术论文,就是萨师煊发表在年的《电子计算机参考资料》上的数据库课程口述稿。在年,萨师煊老师起草了国内第一个计算机专业本科“数据库系统概论”课程教学大纲。他和弟子王珊编制的《数据库系统概论》,放到年也是每个学数据库的人都要学习的教材。(现在似乎修订到第5版了)
等学习数据库的初代学生毕业时,已经是上世纪80年代了。
Oracle的垄断(——)
如果把数据库比作“大脑”,在那个时代,全世界最好的“大脑”就是美国的Oracle。
Oracle很快就把眼光投向了亚太地区,决定进军中国这块“沃土”,注册中文名为“甲骨文”。
在年,Oracle借助“九七工程”在中国站稳了脚跟,这一站,就是数十年。Oracle顺利拿下东三省邮电管理局5期工程的大单之后,中国的电信行业使用Oracle数据库,第一代DBA诞生了。
此时的中国,风起云涌,影响至今的三巨头一个接一个的成立了:年腾讯创立,年阿里创立,年百度创立。年互联网行业开始兴起,随着用户的快速增加,对数据库的需求也越来越大。
中国企业用的是Oracle数据库。这看起来好像没什么问题,在大多数人眼里似乎就像中国人用苹果手机一样正常。
但是致命的问题总是特别简单又直白:贵。
非常贵。
Oracle的标配的是IBM生产的小型机、EMC生产的存储硬件。在当时一台小型机就要万,两台小型机就要配万的EMC存储。
而且要维持“IOE”的整体费用都非常庞大,一笔又一笔的巨额账单是让人闹心的。
巨额的费用就像一座大山,压的每个人都喘不过气。但话语权在别人手里,除了交钱能怎么办?
在年,业界就曾经爆出一条新闻:联通如果要升级到新版本的的产品,必须先交纳万Licence罚款。
这座山,也可以说是用自己的血汗钱给别人堆起来的金山银山。
在巨大的费用面前,无论是大企业还是小公司,都开始寻求另外的解决办法。
改变发生了,甚至最先出现在中国。
随着淘宝和支付宝的用户数量激增,如果要继续用Oracle,阿里巴巴每年就要面临数亿的巨额账单,阿里咬咬牙喊出了“去IOE”,放弃Oracle,使用开源的MySQL。
星星之火,悄无声息的点着了。
中国数据库崛起(——)
年,阿里在王坚的带领下喊出了去IOE的口号,用开源数据库和平民服务器来替换Oracle和小型机。那一年阿里巴巴的公司战略多了这么一句话:“年后,再也不购买小型机。”
越是简单的一句话,越是要付出巨大的代价。
这个困难程度,就像看了一眼房子的结构,就要自己亲手盖房子了。
连续几个月,无数人在屋子里研究《MySQL开源数据库》,有的“先锋队”每周三还会在会议室里交流心得,每天都是扎进千万行级别的代码里,一点点拆开,又重新组装。往往别人该上班了,他们才刚下班。
年5月17日,最后一台小型机下线,Oracle被完全清除出淘宝核心系统,淘宝天猫所有的数据库都从Oracle替换成了自主开源的AliSQL。
阿里巴巴是领头羊,带领着国内的其他数据库公司一同跨越这座大山。
国内的互联网公司逐步用国产的数据库代替Oracle的地位。达梦、人大金仓、神通、南大等一批数据库公司快速发展,并应用于央企、财政等国家专业领域。
除了开源数据库MySQL以外,PostgreSQL、Redis和HBase等开源社区也开始一起寻找中国数据库发展的新方向。
星星之火已成燎原之势。
云数据库崛起(至今)
中国数据库真正走进世界一流行列是什么时候呢?阿里云公布国内首个自研企业级关系型云数据PolarDB技术框架那一天可能要有姓名。
这是自嗨还是公认?
从技术原理上来说,传统数据库是下图左一的架构,计算资源和存储资源是一体的,Oracle的商业数据库就是这样的架构,但这种架构带来的问题是,单个数据库的存储能力有限,读写能力因为绑定也有很大限制,读或者写,系统只能选择干一件事。
PolarDB则有很强的云上产品属性,就是分布式,把计算和存储分离,数据存储层面在云上实现共享,但读写却可以分开进行。以前只能读或者只能写,但是现在却能同时读、写,效率必然大大提升。
这就为数据库打开了一个全新的思路,这也是来自云的解决方案。我们必须庆幸的是,在云这条赛道上,中国没有落于人后。
前几天,国际权威研究机构Gartner发布的《TheFutureoftheDatabaseManagementSystem(DBMS)MarketIsCloud》报告,挑明了数据库市场正在发生的变化。
据Gartner统计,阿里云已位居全球云数据库市场份额第三,年增速在%。同期AWS增速为74%、Oracle为66%。报告认为,数据库的未来必须上云,目前云数据库已为数据库市场的增收贡献一半以上份额。与传统数据库不断下降的营收相比,云数据库正在积极地快速增长。到年,预计有3/4的数据库天然部署或迁移到云上。Gartner将这一变化归因为,企业正将新应用向云转移,对数据存储和计算分析的能力要求不断加强。云数据库天然具备云上灵活性,能够提供强大的创新能力、丰富多样的产品体系、经济高效的部署方式和按需付费的支付模式。
尽管从市场的整个大面上说,Oracle的市场份额仍然很难撼动,但随着它在云数据库市场上的失利、整个数据库市场向云数据库倾斜的大前提下,数据库这道曾经横亘在中国企业、中国技术上的大山终有一天不再是问题。
向推动数据库发展的无数企业和工作人员致敬。