4月7日,全球最主流的版本控制系统——Git迎来15周年纪念日,项目主要维护者JunioCHamano(滨野纯)先生发邮件庆祝了这一日子。
我们知道,所有的软件项目在整个生命周期中都要经过不断迭代,在一个又一个的新版本中完善自己的功能。开源项目更是如此,一个健康的开源项目,在“集市”模式下接受来自世界各地开发者提交的代码,版本更新频率通常更高。如何管理项目的版本更新,是项目开发、维护过程中必须考虑的问题。
什么是版本控制工具
在开始我们的故事之前,首先让我们来认识一下版本控制工具。版本控制的核心述求是历史纪录查询和实现协同开发。以开源项目来说,在多人协作开发的模式下,每个人都向服务器提交自己的文件,就可能存在着代码被多次修改、替换的风险,但是版本控制能够在每次更新操作后进行相应的记录。一旦发生误操作,开发者能够根据服务器中的版本记录,将项目恢复到出现问题之前的其他版本。因此,借助版本控制技术,软件开发项目可以被分割为若干模块,每个模块并行地进行开发工作,从而有效地提高了整体编程效率。
主流的版本控制工具主要分为两种,即集中式与分布式。
集中式版本控制工具类似网吧的管理系统,所有项目的历史文件与版本信息都存放在服务器上,而客户端就只能保存当前的状态信息。这种所有鸡蛋装在一个篮子里的模式缺点非常明显,一旦服务器损坏,项目所有的历史数据就会丢失,因此需要大规模的安全备份。比较有代表性的集中式版本控制工具有SVN、VSS、CVS等。
分布式版本控制工具最大的特性就是任意客户端之间可以互联,当然也包括服务器。这样一来,开发者的客户端本地也存有项目完整的历史记录,当有一个客户端损坏时,可以从另一个没有被损坏的客户端中提取历史数据,恢复之前的状态。在协同开发时,各个客户端之间可以很好地同步开发进度,避免出现重复提交等问题。
毫无疑问,分布式版本控制工具拥有更为先进的理念,其诞生的过程也是得益于网络通信技术的普及与开源社区的蓬勃发展。
天才的帮手
我们的故事始于年,大名鼎鼎的开源项目Linux问世,作者LinusTorvalds一跃成为IT界的大明星,被人们称为天才。由于当时Linux社区仍采用传统的集中式版本管理,开发者提交的patch都汇集到Linus这里,让他肩上的担子很重。
(LinusTorvalds)
在项目早期,Linus以最原始的人力来完成Linux版本管理工作,包括逐条细看每个patch、手动合并开发者提交的代码、更新版本历史信息等。由于这段“痛苦”的经历,Linus本人曾多次公开吐槽“代码管理是计算机领域最无趣的事”……
然而随着社区的逐渐壮大,Linux的系统变得越来越庞大,代码越来越繁杂,继续依靠手动合并代码显然已经不太现实。
年,一家名为BitMover的公司发布了一款收费的分布式版本控制软件BitKeeper,BitMover的CEOLarry给Linux社区特别提供了一个可以免费使用的版本,期望BitKeeper能帮助Linus免于陷入不断加重的Linux内核管理工作中,但条件是不能破解这款产品。
Linus在使用BitKeeper之后不久就爱上了它,直言其是“Besttoolforthejob”。BitKeeper让每个开发者都拥有自己的主副本(mastercopy),完整的副本意味着可以在本地做所有事,而不是所有的patch只能提交到服务器(Linus)这里。于是,Linus可以把一些patch的审查工作交给Liunx子系统的维护者们,对于比较值得信任的维护者甚至不需要他自己再审查一遍,而他只需要对一些自己不太信任的维护者“重点关照”即可。年,Linux内核主线代码就全面开始使用BitKeeper。
尽管BitKeeper的出现赋予了Linux社区更好的协同开发能力,让Linux内核的开发效率成倍提高,但其闭源的特性仍然让Linus在开源界遭到了一些非议。开源泰斗RSM就严厉批评Linus不该使用一款非自由的软件来管理世界上最大的开源项目。这些负面的声音也为之后Linux与BitKeeper的分道扬镳埋下了伏笔。
分道扬镳
事实证明,指望一个全球最活跃的开源社区长期使用一个闭源工具似乎不太切合实际,毕竟这里聚集了一批全世界最有能力的程序员。于是,社区内开始出现“需要一个类BitKeeper的开源工具”的声音,甚至有实干者已经开始着手实现这件事情。
年,Linus本人所属公司OSDL的老板AndrewMorton资助的一个项目组开始对BitKeeper协议进行反向编译,试图破解BitKeeper以创造出一个类似的开源工具。BitMover公司很快发现了这一动作,Larry表示这破坏了免费版BitKeeper的许可协议,尽管这件事或许与Linus本人无关,但确实严重影响了公司的利益,他们最终决定逐步停止对免费版BitKeeper的支持,但会给Linux进行工具迭代的时间。
这样的矛盾在早期的商业公司与开源社区之间十分常见,由于此时与开源项目相关的商业模式并不成熟,很多像BitMover一样的商业软件公司选择站在开源社区的对立面,以保护自己赖以生存的传统商业模式。这些软件公司被业内称为保守派,尤其是以微软、Oracle、SAP等为首的大型软件开发商,他们坚持以付费的原则提供专有企业软件,凭借产品的技术壁垒收取高额的许可费。这样的商业模式不仅被追求开放自由的开源社区所唾弃,高昂的软件采购成本也让很多企业的IT采购人员头疼不已。
不过,BitMover的做法在当时来看确实也无可厚非,他们正当地维护了自己的合法权利,挽回了因产品被破解可能带来的经济损失。但令他们万万没有想到的是,开源社区强大的生产力可以成为他们发展的沃土,也能成为毁灭他们的武器。
用开源的方式创造Git
失去BitKeeper意味着Linux需要重新寻找一个分布式版本控制系统,Linus考察了当时所有的系统,却没有一个能够让他满意。
“于是他在邮件列表里发了一封邮件,说自己写了一些代码,准备作为在找到更好的版本管理系统之前的过渡系统。我觉得这似乎是件挺有意思的事情,于是就把代码下载了下来,看了一下发现只有行。”这是目前Git的主要维护者、Google工程师JunioCHamano(滨野纯)在一次采访中的描述。
是的,天才Linus只花了10天的时间,用C语言写了行代码,这就是如今火遍全球的分布式版本控制系统Git的雏形。Linus把写好的代码发到Linux社区的邮件列表里,并邀请社区里的开发者一起来完善它。“在一周时间内发生了很多事,不过归纳起来就是Linux的内核开发者们听说Linus要用个“新玩意”来管理代码,如果那个‘新玩意’太难用的话大家都痛苦,还不如一起想办法把这个东西做好用点。”Hamano就是收到邮件并首批参与Git项目的开发者之一。
据Hamano回忆,当时Linus考察了市面上所有的版本控制系统,没有一款让他满意的原因是它们都没有代码合并(merge)功能。“因为Linus只写C和Shell,而merge的逻辑实在太复杂,所以他多次发邮件到邮件列表,说要是有人能够用脚本语言实现一个就好了。不过谁也没有上钩。就这么过了一个星期,一直