第4章(1 / 3)

加入书签 本章报错

黑客与画家强烈推荐:

机制

我一直不喜欢“计算机科学”puters9๗ce这个词。主要原因是根本不存在这种东西。计算机科学就像一个大杂烩,由于某些历史意外,很多不相干的领域被强行拼装ณ在一起。这个学科的一端是纯粹的数学家,他们自称“计算机科学家”,只是为了得到国防部研究局darpa的项目资助。中间部分是计算机博物学家,研究各种专门性的题目,比如网络数据的路由算法。另一端则ท是黑客,只想写出有趣的软件,对于他们来说,计算机只是一种表达的媒介,就像建筑师手里的混凝土,或者画家手里的颜料。所以,在“计算机科学”的名下,数学家、物理学家、建筑师都不得不待在同一个系里。

书中的内容并不深奥,不仅仅是写给程序员和创业者的,更是写给普通读者的。作者最大的目的就是,通过这本书让普通读者理解我们所处的这个ฐ计算机时代。

对于互联网软件,没人规定只能使用某些语言开,因为所有的硬件都控制ๆ在你手里,你想要用什么เ语言,就能用什么เ语言。不同的语言适合不同的任务,你应该根据不同场合,挑选最合适的工具。尤其是在竞争者存在的情况下,“可以这样做”就变成了“必须这样做”详见后文,因为如果你不利ำ用语言的优势,那就会听任对手过你。

我们的大多数竞争者使用c和c++,这使得他们的软件明显不如我们,因为不考虑其他原因他们无法解决cgi脚本不能识别用户状态的问题。如果用户想要修改表单的部分内容,你不得不把表单的所有内容都放在同一个页面上,然后在最下面放一个ฐ“更新”按钮๢。正如我将在第12章中ณ解释的,通过使用lisp这种许多人眼中ณ的教学语言,我们使得via9๗ebຘ编辑器更接近桌面软件带给用户的体验。

软件的布๧

互联网软件带来的最大变化之一,就是软件布方式的改变。对于桌面软件来说,布新版本是一个很痛苦的过程,整个公司不得不使尽全力,满头大汗地挤出一大块巨型代码。从过程和结果上来看,无异于一次分娩。

互联网软件则ท完全不同,就像你写给自己用的程序一样,修改起来很方便。软件的布过裎可以分解为一系列ต的渐进式修改,而不是猛地推出一个大幅变动的版本。常见的桌面软件可能一年布一到两ä个新版本,而我们在via9eb经常是一天布三到五个版本。

一旦采用了这种新模式,你就会知道布方แ式对软件开的影响有多么重大。桌面软件开之ใ中的许多棘手问题๤,都是源自于它的那种灾难性的布方式。

如果一年布一个新า版本,你很可能会以打包方แ式处理bug,把它们留着,然后一次性全部ຖ解决。在布新版本前,你可能会修改和更换一半的代码,从而又引入无数新的bug。接着,质量监控人员quaທlityaທssurancນe开始测试新า代码,逐一列出新现的bug,你再按照这张清单把它们一个ฐ个消除。通常没办法把清单全部做完,它随时都在增长,说实话,谁也不确定它到底会有多长。这就好像在足球场上捡小石块一样费劲,你永远不知道为什么软件内部会出这么多问题。最好的结果也不过是,你得到了一个统计学意义แ上“合格”的版本。

对于互联网软件来说,大部ຖ分的变化都是细微和渐进的,所以引入bug的机会比较小。而且,在布前测试的时候,你知道应该最仔细地测试哪个ฐ部分——显然就是你修改过的部分。这使得你对代码的掌握变得牢固得多。一般来说,这时候你确实是对软件内部的情况一清二楚。当然,这不是说你把所有代码都装在了脑子里,而是说你阅读代码的时候,非常自如流畅,不会像侦探破案那样苦思冥想,而是像飞行员那样,瞄一眼仪表板,就对飞行状况胸有成竹。

桌面软件导致了bug的宿命论。你很清楚,布出去的软件肯定有bຘug,你甚至早ຉ就准备好了应对机制比如布补丁。既然如此,bug再多一点又何妨?没过多久ื,你要布下一个版本了,你明知其中某个操作完全不能使用,但还是照样布。苹果公司前几年就干过这种事。他们必须布新版操作系统了,压力越来越大,布日຅期已๐经推迟了四次,无法再推了,可是有些部ຖ分还一点儿没写比如cd和dvd操作的部分。怎么办?他们就把没写完的操作系统布出去了,用户必须日后自己动手安装缺失的部分。

互联网软件的布规则是:它运行不了,你就无法布๧;一且它能运行了,你就可以立刻๑布。

这个ฐ行业的老手可能会想:你说得好听!软件运行不了,就不布,但是如果你已๐经对外承诺了明确的布日期,到时却没有准备好,怎么办?这个问题听起来有道理,但是事实上,你不会对互联网软件做出这样的承诺,因为它根本没有“版本”这个概念。你的软件是连续性渐变的,某些更新也许比较重大,但是“版本”这个概念不适用于互联网软件。

如果你还没忘记via9๗eb的旧事,你可能ม会觉得我这么เ说听上去很奇怪,因为那时我们总是宣布将有新版本推出。这只是公关伎俩啦,我们知道媒体喜欢听到เ版本号。如果你布一个ฐ大的版本更新版本号的第一位数生变动,它们就会以大篇幅报道;如果你布一个ฐ小的版本更新版本号小数点后生变化,它们最多只用一段话提一下。

我们的一些竞争对手的产品是桌面软件,确实有版本号。对我们来说,这种布๧方式只表明他们的落后,但是他们却因此把媒体的目光都吸引过去了。我们不想做局外人,所以也开始为自己้的软件加上版本号。什么时候需要媒体宣传了,就开出一张单子,上面总结了自从上次“布๧”以来,我们新增的所有功能,然后在上面填一个新的版本号,出一个新า闻稿,宣布新版本已๐经准备就绪了。真是神奇啊,从来没有人看穿我们的把戏。

到被收购的时候,我们已๐经这样干了三次,所以已经到了第四版。如果我没记错的话,那时是41版。via9ebຘ变成yahoostore以后,媒体的曝光就没有那么必要了。所以,虽然软件一直没有中ณ断开,但是版本号却悄悄地被放弃了。

软件bug

互联网软件的另一个ฐ技术优势在于,你能再现大部ຖ分的bຘug。用户的数据都在你的硬盘上。如果某个用户使用软件时出错了,你就不必像开桌面软件那样苦苦猜测到底生了什么事情。一般来说,只要用户通过电å话向你描述一番,你就能把问题再现出来。如果你的程序中有自动侦测错误的代码,那么不用等到เ用户找上门,你可能已经知道哪里出错了。

互联网软件每时每刻๑都在被使用。你的代码一上线,就会经历严å酷考验。bຘug很快就会浮出水面。

软件公司有时会受到指责,因为ฦ他们竟然把现bug的任务交给用户去完成。说实话,我其实提倡这种做法。对于互联网软件,这样做的好处很多,因为它的bug相对比较少,而且处理周期比较短。我们连续不断地布新版本,所以bug就比较少。我们能够再现用户遇到的问题,又能ม在修复后立刻布,使得用户不用等很长时间,所以大部ຖ分bug的处理周期都比较短。我们的bug数量一直不多,以至于没有必要使用一个ฐ正式的bug追踪系统。

当然,在布๧之前,你应该对修改之处进行测试,避免出现重大的bug。难免会有一些bug成为漏网之鱼๠,不过它们纯属罕见情况下才会生的个案,在真正接到用户投诉之前๩,几乎不会影响到เ什么人。只要你能立刻๑解决bug,对于普通用户来说,他们就会觉得你的软件几乎是亳无຀问题的。我觉得,普通的via9eb用户可能ม一个bug都没遇到เ过。

解决新代码的bug要比解决历史遗留代码的bug容易。在自己้刚刚写好的代码中,找出bຘug往往会比较快。有时,你只要看到เ出错提示,就知道问题出在哪里,甚至都不用看源码,因为潜意识中你已๐经在担心那个地方แ可能会出错。如果你要解决的bug出自于6个月前写好的代码假定你一年布一个新版本,那么6๔个月就是现bug的平均时间,那ว么就麻烦了,就要大费周章了。那时,你对代码也๣已经不熟悉了,就更可能采用危险的方式解决问题,甚至引入更多的bug

‘这个观点引申自特雷弗·布莱克韦尔trevorblaທck9ell的话,他说:“随着软件规模的增大,开成本指数式上升。这可能是因为修正旧bຘug的原因。如果bຘug都能被快现,成本的上升形态就能ม基本保持线性。”’

早一点现bຘug就不容易形成复合式bຘug,也๣就是互相影响的两个bug。举ะ例来说,一个bug是楼梯很滑,另一个ฐbug是扶手松了,那么只有当这两个bug互相作用时,才会导致你从楼梯上摔下来。在软件中,复合式bug是最难现的bug,往往也会导致最大的损失

。传统的方แ法是:“把软件彻底拆开,将所有bຘug统统清理干净。”这样做难免产生一大堆的复合式bຘug。如果软件是经常性布๧,每次只有小幅度的变化,那ว么就不容易产生复合式bug。这就好比做扫除:你一直在打扫大厅,掉落在地板上的东西会被立刻清理,省得它们时间一长与其他东西粘在一起。

‘复合式bug有一个子类型:两个bug是互相弥补的,好比“负负得正”,软件反而能正常运行。这种bug可能ม才是最难现的bug。当你修正了其中的一个bug,另一个bug才会暴露出来。这时对你来说,你会觉得刚才修正错了,因为那是你最后修改的地方,你就怀疑自己้在那里做错了,但是你其实是对的。’

有一种编程方法叫做“函数式编程”fun9๗g,它对你会有帮助,可以避免一些副作用。函数式编程在学术文献中研究得比较多,在商业软件中用得比较少。但是,对于互联网软件,它却很有用。很难用纯粹的“函数式编程”完成整个程序,但是它可以用来编写一些重要的部ຖ分,使得这些部分易于调试,因为ฦ它们不包含“状态”state,非常便于不断进行小幅的修改和测试。我大量使用这种方แ法开via9eb的编辑器,我们自己的脚本语言rtml就是一种纯粹的函数式编程语目。

桌面软件行业的人可能很难相信,找出via9eb的bug几乎成了一种游戏。因为软件布๧以后,大多数bug都是罕见情况下才会生的个案,受到影响的用户往往都是高级使用者,他们喜欢试验那些不常用的、难度大的操作。高级使用者对bug的容忍度比较高,尤其如果这些bug是在开新功能ม的过程中ณ引入的,而这些新功能又正是他们所需要的,他们就更能理解了。事实上,因为ฦbug不多,你只有经过一些复杂的过程以后才会遇到它们,所以高级使用者往往因为现了bug感到เ很得意。他们打电话给客服时,多半是一副胜利者的口吻,而不是怒气冲冲的样子,好像他们击败我们得分了一样。

客户支持

当你可以再现错误时,你开展客服支持的方式就变了。大多数软件公司将客户支持看作提高客户满意度的一种方式。在这些公司看来,要么เ是客户打电话来,报告一个ฐ已知的bug,要么是客户执行了错误的操作,你必须ี判断出他到底什么地方做错了。这两种情况对公司的知识积累都没有太大益处。所以,你开始觉得客户支持是一件令人头痛的事情,决定将客服人员与开人员尽可能ม分离。

viaທ9eb不是这样。我们的客户支持是免费的,因为我们希望知道用户的反应。如果他们使用时遇到เ困难,我们希๶望立刻知道,这样就能再现错误、解决问题、布新版本。

所以,viaທ9eb的开人员总是与客服人员保持密切联系。客服人员坐在距离程序员只有9米的地方,知道自己可以随时打断程序员的工作,提交新证实的bug的报告。遇到เ重大bug,我们就算在开董事会,也会马上回来修改程序。

我们的这种方法让所有人都感到满意。客户很高兴,拨打厂商服务热线是免费的,而且还被当作通风报信的人,受到เ郑重对待。客服人员也๣喜欢这样,因为这使得他们可以帮助用户,而不是对着用户读操作手册;程序员喜欢这样,因为他们能ม够再现bug,而不是通过模糊不清的二手报吿了解bຘug。

我们的政策是当场修复bug,这改变了客服人员与黑客之ใ间的关系。在大多数软件公司,客服人员是低工资的边缘人,黑客则ท是呼风唤雨的主宰者。这些公司有各种各样的bug报告流程,伹是几乎都是单向式的:使用者打电å话给客服人员报告bຘug,客服人员填写某种形式的表格,传递给程序员可能ม会经质量监控部门之手,程序员把bug写入待解决问题的清单。viaທ9eb不是这样,在收到使用者的bug报告之后一分钟็内,程序员就会对站在身边的客服人员说:“没错,你是对的,这是一个ฐbug。”客服人员从黑客嘴๨里听到“你是对的”,会感到欢欣鼓舞。客服人员告诉我们现bug的时候,他们心里怀着期待,就好像小猫想让别人知道自己้抓住了一只老鼠一样。这也使得客服人员在判断ษbug严重性时格外小心,因为这关系到เ他们的声誉。

我们被雅虎收购后,客服人员被移到เ离程序员很远的地方。直到เ那时,我们才意识到客户支持实际上就是质量监控,也๣是某种程度的市场营销。除了记录bug,客服人员还必须大概了解相关知识,回答与bຘug相关的一些问题、解释令使用者迷惑不解的功能等

。有时,他们也๣扮演了使用者的代理人,我们会问他们哪个ฐ新功能ม是用户更想要的,他们总是能做出正确的回答。

‘我们在via9๗eb举办过一个比赛,看谁能ม说出我们软件中最差ๆ劲的地方。两位客服人员并列ต第一,我至今想起他们的叙述都不寒而栗。比赛一结束,我们立刻修复了那两个ฐ问题。’

全身心投入

能够即时布软件,对开者是一个巨大的激励。步行上班途中,我经常会想哪些地方还需要变动,然后当天就予以实现。一些重大功能也๣是这样来的。即使某个功能要花两ä个星期或者更长时间开,我也๣很确定,一旦写完就可以立刻看到效果。

如果软件的新า版本要等到一年后才能ม布,我就会把大部分新构思束之ใ高阁,至少过上一段时间再来考虑。但是,构思这种东西有一个特点,那就是它会导致更多的构思。你有没有注意过,坐下来写东西的时候,一半的构思是写作时产生的?软件也๣是这样。实现某个构思,会带来更多的构思。所以,将一个构思束之ใ高阁,不仅意味着延迟它的实现,还意味着延迟所有在实现过程中激的构思。事实上,将一个构思束之高阁,甚至会限制新า构思的产生。因为ฦ你看一眼堆放在一边、还没有实现的构思,就会想“我已๐经为下一个ฐ版本准备了很多新东西要实现了”,你就懒โ得再思考更多的新功能了。

大公司的做法不是立刻实现新功能,而是先对新功能做一个计划。我们在via9eb就是因为这个原因而遇到เ了麻烦。投资者和分析家会问,你们对未来有何计划。真实的回答是,我们没有任何计划。我们有改进的想法,但是如果我们想到เ应该怎么改进,就已经把它实现了。接下来六个月我们要做什么?所有能想到的最佳改进。我不知道自己是否有胆量公开这么เ说,但这是实话。计划这个词,只是将构思束之高阁的另一种表达方式。只要想到เ好的构思,我们就立刻着手实现。

viaທ9eb和其他许多软件公司一样,大部分代码都有明确的负责人,而且只有一个。如果你负责某件事,那就真的是你负责。除了你以外,没有人能ม批准他们甚至都不知道这部分代码的布。如果你出错了,没有人会提醒你,唯一的代码保护机制就是你的羞耻心,你不想被同事当成傻瓜,这就足矣。我这么说或许会让人误以为via9eb的代码是漫不经心地编写出来的。实际上我们的开进度很快,但是把代码放到服务器上布之ใ前,我们会深思熟虑。提高软件可靠性的关键在于开时全神贯注,而不是降低开度。正是因为飞行员全神๰贯注,他才能ม在夜间让一架18๖吨重的飞机以2๐25公里的时平安降落在航空母舰的甲â板上,做得比小孩子切面包还要安全。

当然,这样写软件也有局限。它适用于小型的、由优秀可靠程序员组成的开团队,不适用于大型的、充斥大量平庸之辈的软件公司,在那ว里不是程序员想出好的构思,而是一个委员会集体批准坏的构思。

逆向的《人月神话》

‘《人月神๰话》themythi9th是布๧鲁克斯fredericນkooks所写的一本软件项目管理名着。所谓“人月”就是一个人在一个月内所能完成的工作量。假如某个项ำ目预ไ估需要12个人月,那么เ派4๒个人处理这个项目,理论上需要3个月,派6๔个人则只需要2个月。但是,布鲁克斯认为这种换算机制ๆ在软件业行不通,是一个ฐ神话,因为软件项目是交互关系复杂的工作,需要大量的沟通成本,人力的增加会使沟通成本急剧上升,反而无法达到缩短工期的目的。在本质上,软件项目的人力与工期是无法互换的,当项目进度落后时,光靠增加人力到该项目中ณ,并不会加快进度,反而有可能使进度更加延后。该书英文版已由人民邮电出版社ุ出版。——译者注’

幸好开互联网软件需要的程序员比较少。我曾在一家中等规模的桌面软件公司工ื作,那里的工程部ຖ规模就过10่0人,但是其中只有13人负责产品开,剩下的人负责软件布、软件移植以及其他事情。开互联网软件,你最多只需要那13个ฐ人,因为不存在软件布๧、软件移植以及其他事情。

via9eb的开者只有3个人

。我一直在不停地招聘,压力很大,因为我们要把公司卖掉。我们很清楚地知道,买家不愿花大价钱买下一个只有3个程序员的公司。解决方法:雇更多的人,在公司内创设其他项目,让他们去做。

‘罗伯特·莫里斯写了客户下单的前台订单系统,特雷弗·布莱克韦尔写了图片系统和后台管理系统商家用来处理订单、查看统计数据、修改设置等,我写了站点生成器商家用来搭建网站的外观。订单系统和图片系统的开语言是c和cນ++,后台管理系统主要是perl,站点生成器是摸nlisp。’

开软件需要的程序员人数减少,不仅意味着省下更多的钱๥。正如《人月神话》一书中所指出的,向一个项目增加人手,往往会拖慢项目进程。随着参与人数的增加,人与人之间需要的沟通呈现指数式增长

。人数越来越多,开会讨论各个部ຖ分如何协同工ื作所需的时间越来越长,无法预ไ见的互相影响越多越大,产生的bug也๣越多越多。幸运的是,这个过程的逆向也成立:人数越来越少,软件开的效率将指数式增长。我不记得我们在via9๗eb开过讨论如何编程的会议。步行去吃午饭的路上,我们就能把该说的话说完,从来没有例外。

‘这里的“指数式”exponentially,我用的是口语中的表达方式。更合适的词应该是“多项ำ式似的”polynomially。’

如果要说有什么缺点,就是由á于开人员比较少,每个程序员都必须承担一点儿系统管理的责任。当你在服务器上布软件时,必须有人监控服务器,但是由á于人员太少,监控员只能由开人员兼任。via9ebຘ有许多系统组件,变动非常频繁,导致应用软件和系统软件之间的界ศ线很难区分。硬性指定一条界线将限制我们的开。所以,虽然我们总是安慰自己,公司运营很快就能走上正轨,一两ä个月后就能ม平稳展,那ว时就可以雇一个专职的系统管理员让他专门负责服务器了,但是这个愿望一直没有实现。

↑返回顶部↑

书页/目录

黑客与画家