采访/撰文:宇婷
TiDB是一个有“生命”的数据库。
到年,TiDB的SQL层有多次PR提交,60%的代码更新。到年,TiDB又有一半的代码迭代。根据TiDB官方数据,在ASKTUG论坛里,关于TiDB70%的问题是社区用户自己帮助自己解决,不需要找PingCAP官方支持。
从一开始想解决MySQL分库分表需求,定位为NewSQL。到进化为HTAP(HybridTransactionandAnalyticalProcessing,混合事务和分析处理)数据库。
这是一个和自己出生第一天已经不同的数据库,也是一个每一年都和上一年不同的数据库。
TiDB自己在“生长”。
黄东旭是TiDB的主要设计者之一。他和搭档刘奇、崔秋在7年前,原创设计了这款分布式数据库软件,并创立其背后的公司PingCAP。
在TiDB之前,中国本土几乎没有从0到1做出的能够被全球用户使用的基础架构层的软件。也没有能够位列国际开源社区前列的,由国人主导的数据库项目。
年国际数据库会议VLDB收录了黄东旭作为第一作者的论文《TiDB:ARaft-basedHTAPDatabase》。这是业界第一篇Real-TimeHTAP分布式数据库工业实现的论文。
年4月,TiDB5.0版本引入MPP模式。TiDB将查询的计算下推到TiFlashMPP集群,借助分布式并行计算,TiDB成为了一个真正的Real-timeHTAP数据库。
但TiDB还在进化。
“PingCAP和过去半年比,是一家不同的公司。”
黄东旭在不久前接受TOB新势力采访时表达。从去年“火车模型”研发流程到今年云上交付,TiDB从纯粹的开源软件到面向企业级的数据库产品,正在成为云服务提供商。
云会支撑TiDB用户Self-servicing的程度,使之向规模化、标准化、自主化发展。TiDBCloud在全球范围正式商用。
在去年PingCAP的开发者大会DevCon上,黄东旭曾提出自己对未来数据库的预测:“数据库作为独立的软件形态会消亡。”
他认为云计算趋势下,未来数据库独立软件会演化为数据服务平台。
作为PingCAPCTO、联创的黄东旭,他在过往采访中多次提到对谷歌、Snowflake几篇重要论文的重视,这启发了他在早期技术路线和商业趋势上的选择。另一方面,也展现出一种技术人对数据库本质的洞察和技术自信。
PingCAP最早投资人经纬中国合伙人熊飞在不久前的媒体采访中表达:“我觉得在中国,其实并没有全世界顶级的底层架构产品,不管是数据库也好,存储也好,网络也好。PingCAP这家公司,我觉得是有机会在这个领域实现零的突破。”熊飞的团队几乎看过中国绝大部分TOB项目。
在中关村东升科技园的办公室里,有一些明显呈现出几何形状的小隔间和会议室。这些几何图形来自于PingCAP的Logo。PingCAP的名字和Logo是黄东旭设计的。
绝大部分第一眼见到他的人会说一句:“没想到PingCAP的CTO这么潮!”与产业研究形成反差的是,黄东旭本人说话风趣,语态偏向90后。他梳着摇滚乐手的披肩发,喜欢穿T恤,讲起TiDB的结构、Rust和Unix哲学,手势飞舞就像是在弹琴。
他几乎符合《大教堂与集市》中对黑客(着迷于计算机技术并通过编程提供极具价值软件的人)的所有描述:写得一手好文章、阅读科幻小说、禅修、欣赏摇滚、用词幽默以及画画。
在PingCAP,大家都很喜欢《禅与摩托车维修艺术》这本书。书中的主人公骑着摩托车旅行,在自然、野外、旅店和机车维修之间探讨辨思。
黄东旭正是这位骑手。
《禅与摩托车维修艺术》书插图
01向自己提问
“约翰看到摩托车的时候,只看到各种形状的金属,于是就厌恶它。但我却看到设计者的理念。约翰认为我接触的是各种零件,实际我接触的是各种观念。”《禅与摩托车维修艺术》书里写道。
除了发型,黄东旭最与众不同的气质是他对技术“叛逆”的追问和观点。
他写了很多博客文章去阐述对开源的思考,透露出与众不同的角度。比如,当你在思考开源社区和商业化的共存时,他抽象为那是“河与岸上的人”。当你在思考系统设计时,他类比为从复杂生命体的交互中找到真正对抗复杂性的方法。
创业开始,黄东旭给自己提问:
如何能在五分钟之内去说服企业客户的CTO用TiDB?
他的答案是:年第一个TiDB版本解决了MySQL的扩容需求,这个切入点带来了TiDB早期的快速发展,这也回答了TiDB客观存在的必要性。
TiDB是一个新技术,在六七年前想替换用户的MySQLOLTP,这样一个新软件和一家创业公司,如何获得信任是一个很现实的挑战。
黄东旭又给自己提问:凭什么用户要用进核心系统里面?用户怎么能够信任你?TiDB设计成一个不错的软件后,如何让用户知道你?进入评估名单?得到了用户的信任,同时也有很好的曝光,如何保证自己的成熟度?
早期他参与研发的开源项目Codis已有受众基础,网易有道和豌豆荚的工作经历,让他思考清楚一点:
做出一个好的新的软件也许难,但真正的挑战在于能够让客户和潜在用户信任和愿意使用。
“人无完人,软件设计者也是有盲区的,让软件变得好用的一条出路是——让更多用户使用,在用户的反馈中形成对软件交互的迭代。”
主创团队对开源的信仰和专业判断,让“开源”成为PingCAP的第一个飞轮。开源是使得整个软件的设计过程保持不断换位思考,定位出软件的重度使用者,让用户的声音快速传播。
这种声音传播在本质上打破的是闭源软件的信息不对称,是更先进的软件生产关系,也是TiDB能够“自生长”的机制。
02开源×云=?
如果说开源改善了软件的生产关系,云带来的质变就是生产力。
“下一代数据分析和处理,以开源的模式迭代,一定发生在云端。”
黄东旭表达他看到的趋势。
年PingCAP的DevCon上,黄东旭自己将数据库的未来抽象为一个公式:
可插拔性(存储、计算)×调度能力(颗粒度、细粒度)×云弹性资源=?
这个公式的含义在于TiDB和核心特质是存储和计算的可插拔与开放性;细粒度的调度能力。
在Real-timeHTAP的物理层面之下,黄东旭把TiDB抽象成复制、分裂、合并、移动的“细胞”。细胞不断分裂生长,如果再赋予一个近乎无限的弹性资源池,高速迭代和动态进化就会超出想象。
年春他飞往湾区,PingCAP新的办公室就在谷歌旁边,那里有来自MySQL、MongoDB的SunnyBains、BrianWalters等接近60位同事。
年,当时PingCAP要出海,PingCAP在硅谷没有人脉。出旧金山机场,黄东旭拎着一只行李箱。“你都不知道当天晚上要住在哪里。”他回忆。
今年,他不再是一个人了。有琴,有硅谷的同事,以及一起同行的中国同事们。
插图:TiDB硅谷合照,二排左三为黄东旭
拜访美国客户最重要的感受是:大家关心的不是TiDB的技术牛不牛,而是这个技术到底能够帮助自己多快走向市场,比自己的竞争对手领先一步。
服务是TOB的重要属性,但平等的对话是新一代企业服务的重要特质。这种平等是建立在为企业客户解决问题的基础之上。
“真正的迭代速度或者说更有价值或更有意义的迭代速度在于
你的软件怎么帮助应用开发者更快地开发出他的应用。这能给应用和业务赢得更多的时间。
”黄东旭强调。
这句话看似老生常谈,其实背后有新的意义。
OSSinsight是PingCAP团队最近开发的一个应用,可以实现基于47亿条数据对开源项目进行洞察,发现一些开源项目的潜在客户或者行业