所在的位置: mysql >> mysql市场 >> 大数据大佬访谈录

大数据大佬访谈录

中科白癜风公认好口碑医院 http://news.39.net/ylzx/bjzkhbzy/index.html

InfoQ:您从年就开始从事面向大数据场景的分布式数据库研发工作,这期间您经历了大数据领域哪些新老技术的更迭和演进?沈春辉:在大数据发展史上,有两个影响深远的标志事件,一个是年前后,谷歌发表GFS、MapReduce、Bigtable三篇论文,证明了大数据从理论概念到生产实践的业务价值,并给出了架构典范;另一个是年,Hadoop正式成为Apache顶级项目,把大数据带入到各大企业尤其是互联网企业的IT基础设施中。在过去的十多年,随着对数据规模、处理速度、易用性、成本、效率等越来越多的需求,我们看到大数据架构和产品不断地推陈出新。起初,Hadoop作为大数据的代名词,支持存储和计算能力的水平扩展,很好地解决了规模化的挑战,但随着大数据应用到各个场景,各种需求开始井喷,Hadoop也从单一系统走向一个多元化生态。比如:Hive,让SQL进入到Hadoop,大大降低了使用门槛;HBase,通过LSM架构,满足了海量数据的高并发吞吐;Spark,通过基于内存的分布式计算,大幅提升了数据处理的效率;Storm、Flink、SparkStreaming等流计算系统,有效提升了数据处理的实时性;还有Presto、Kylin、Impala等,在不同场景下,加速大数据复杂分析。所以,现代企业的大数据平台大多都是基于Hadoop生态构建的“一存多算”的多元化架构,即以HDFS为统一存储,通过HBase、Spark、Flink、Presto等多种计算引擎满足不同场景的处理需求,这个架构的优点是适用范围广、灵活性强,但缺点是成本高、维护复杂、体验较差,这也会是未来技术继续向前演进的方向。InfoQ:您将在QCon深圳分享的话题是“面向多模数据管理的技术创新与实践”,在您看来,当前多模数据库的发展整体处于一个什么样的阶段?沈春辉:在互联网发展之前,数据库可以说基本就是在关系模型上发展,比如发展了几十年的Oracle、DB2,而NoSQL的出现打破了这一惯性,KV、宽表、文档、图、时序等多种模型都得到了广泛应用和快速发展,但这个趋势也会使得应用开发变得越来越复杂,记得在年的NoSQL大会上,有大佬提出了“多模数据库”的概念,设想一个系统可处理多种类型数据,以简化应用数据架构,减少开发维护成本。随着NoSQL系统在单模能力上的成熟,以及应用数据需求的多样化,业界开始进入对多模数据库的探索和实践,通过db-engine网站,我们可以看到越来越多的流行数据库已经走向多模数据库。多模数据库,其目标是将多个系统组合使用的解决方案下沉为数据库内置能力,与传统分库分表方案升级为分布式数据库能力相似,所以,这是一个相对漫长的建设过程,我们为其定义了四个阶段,也可以说是系统开发的四个路标,分别是多种类型、垂直引擎、跨模融合、统一访问,如果按此看,那么大部分业界多模数据库现在可能处于第一、二阶段,其能力主要是提供多种类型的数据接口,在不同模型的处理效率上有所侧重倾斜,在数据联接上有所缺失,还是很难在生产中真正替换多套系统组合使用的方案。InfoQ:是什么原因驱动阿里从HBase转到多模数据库的?整体架构设计是如何考量的?沈春辉:阿里HBase的发展已经有比较长的时间,过去主要聚焦在成本、性能、可用性等通用能力的深度自研,所以,在这个方向上算比较成熟了。然而,现代应用场景的玩法和功能变得越来越丰富,除了高扩展、低延时、高可用、低成本等核心需求之外,简单分析、多维检索等高级数据处理正在成为越来越多应用的基本需求,为此,我们看到当数据量小的时候,一个关系数据库基本能解所有问题,但数据量大的时候,很多场景需要混用HBase、ES、TSDB、SQL等系统,像是监控、IoT、画像、社交等等,每一个应用都需要开发数据中间层来对接多种数据库,去处理模型转换、数据分发、数据同步、查询合并等一系列问题,最终期望这多个异构系统组合成为一个数据库系统工作,面向上层的业务逻辑提供统一存储、统一访问并保证数据正确。针对这种普遍存在的共性需求,我们期望使用多模数据库的思路进行解决,打造一个同时具备宽表、时序、搜索等多种模型处理能力的数据库,帮助业务重新聚焦于应用逻辑,这就是我们年9月上线的云原生多模数据库Lindorm(中文名:灵动)。Lindorm目前主要聚焦于第三阶段跨模融合的能力建设,在业务需求满足上,可以达到及超过多套系统组合使用的效果,并相比有明显更低的开发维护成本,随着系统能力的逐渐完善,对业务的价值优势也会越来越明显。Lindorm在系统架构上主要考虑了云原生、多模原生两个方面,核心是构建弹性按需伸缩、多模融合处理、高效低成本等能力,具体的架构设计也将在此次的QCon会议上分享,欢迎大家的


转载请注明:http://www.aierlanlan.com/rzdk/3687.html