在过去的几年里,因特网是全世界都在谈论不休的话题。一部分人在疯狂地追逐网络,另外一部分人说“网络不过是一个越来越大的泡沫”。实际上,网络是一个媒介,只是为我们提供一个平台,真正有意义的东西是网络上的内容。网络对于网络上的内容,有如纸张对于纸张上的内容。人们想要的东西是报纸书刊上的文字和图片,而非纸张。所以,内容是决定一切的。网络不是泡沫,但没有内容的网站是泡沫,这情形就像是给了人家一张开满“天窗”的报纸。
然而不论网站的泡沫是否破灭,因特网都已将这些生机勃勃的比特变成无论种族不分国界人人可以享有的498资源。从表面看,这是用户的幸事。但是,当因特网将这么多数据转换成字符、线条、颜色、图像、声音或者视频的时候,问题也就随之发生:没有一条线路能够将如此巨大的数据顺畅无阻地由此地传递到彼地。就算你能耐心等待那些数据全部到达目的地,在那比特构成的海洋中,又怎能轻易找到自己想要的“一根针”?这情形很像你在北京城庞大的交通网上,在140万辆流动的汽车中寻找你女友驾驶的那一辆,如果没有有效的指引,必会无功而返。而因特网上流动的比特却是数以兆亿计的,其搜寻的艰难,自然可以想像。
伴随网络技术的每一次突破,都必然有软件功能的不断增强。对于因特网上种种尴尬的情形,科学家的办法,主要集中在三个领域:一个是多媒体化;一个是可移动化,也即无线通讯;一个是网络化。“信息业走向哪里?就是这三个方面。”张亚勤这样概括他对未来的判断:“因特网是这三个东西的交互,处在中心的位置。”
其解决问题的基本路线如下:获得--压缩--传输--检索--提取--再现首先,如果计算机不能“获得”各种自然形态的数499据,比如语言、图像、声音等等,一切都无从开始。然后,如果不经“压缩”一环,以目前因特网的水平,显然不能容纳如此大量的数据。但“压缩数据”与“压缩饼干”不同。后者可以把所有原料搅合在一起,改变原有形态,面粉脂肪白糖等等不必分出彼此,“压缩数据”
如果也像“压缩饼干”,那就完全无用。它必须能够在必要的时候恢复原有形态,它要求最快的速度、最好的质量和最低廉的成本,这是“传输”。还必须让所有人都能准确迅速地“大海捞针”,这是“检索”。人们处理比特的工具越来越多,个人电脑之外,已经有了种种形式的无线通讯,比如正在流行的掌上通、手机和电视机顶盒,所以同一次传输和检索过程必须能够适应所有这些设备,也即专家所说“可移动的环境”,这是“提取”。最后是数据的“再现”,这包括数据的还原过程和一个让用户最容易操作的界面。
这一过程在1999年春天曾出现在张亚勤办公室的白板上。那一天,李开复和张亚勤在一起讨论科研的基本线索,张亚勤在白板上画出一个流程图。后来一年的事态发展证明,将网络多媒体3个研究小组的目标集中起500来,就构成了这个流程的从头到尾。
如果我们用最简单的语言来描述这3个小组的目标,那就是,沈向洋小组解决的是数据的“获得”。张亚勤小组要解决数据的“压缩”和“传输”,张宏江小组要解决数据的“检索”和“提取”。这里所谓“数据”,包括了语言、声音、纹理、图像,还有视频(再现的工作,多数小组都会涉及)。
张亚勤以往在世界计算机软件业的地位,正是来自他在数据“压缩”和“传输”方面所做的贡献。而张宏江则是全世界数据“检索”和“提取”的“鼻祖”。这两个人分别在自己的领域中已经努力了十几年,卓有建树。
然则,计算机技术的发展似乎总是走在他们的前面。
当一台电脑吃力而又缓慢地把一幅图像显示在屏幕上的时候,任何人都会感觉到等待的焦躁和烦恼,同时又会感受到画面逐渐呈现带来的喜悦。但在专家们的眼里,那屏幕上显示的东西并非图像,而是成千上万颗小圆点构成的一张网。他们把那些圆点叫做“像素”,同时认定,大部分像素其实只是重复。比如一幅照片上,千万个蓝色圆点组成蓝天,其实这只是一个蓝点的重复。
501专家们通常用“冗余度”来描述这种现象。所谓“数据压缩”,也就是把“重复”先行取消,等到用户提取图片的时候再还原。这对运动着的图像特别有效,因为我们只需保留后一幅与前一幅的区别,而将所有相同之处全部删去。科学家在以往的工作中,已经有可能将数据压缩至1%…2%。其余均为“冗余”。你可以设想,当一条高速公路上的汽车流量减少了98%的时候,会是怎样一种局面。
但情况并非如此简单。张亚勤小组现在就面临着一个新的棘手问题:压缩与传输,和网络资源的情形联系在一起。网络传输的带宽(“带宽”的意思,如果形象地表述,就是线路的宽度,在固定的时间段中,越“宽”
的线路,可以传输越多的数据),并非固定不变。在同一条线路上,数据的传输有着快慢多少的区别。这情形如一条电话线上,一个人“占线”的时候,另外一个人的话音就必须等待。张亚勤小组的想法是,让数据的传输根据带宽的变化来自动调节。这就不但要将数据“压缩”
得好,还要拥有其他的功能。比如在道路拥挤的情况下,就让路上的汽车缩小,如果还是拥挤,只好停止一些次502要汽车的通行,而让重要的汽车优先通过。而在道路良好的情况下,又能让延误的车辆迅速地赶上来。又比如,由于压缩的奥妙是裁减“冗余”,以一当百。所以一幅图像上的微瑕,就会一直延续到最后。因此有必要让系统具有解析和纠正错误的能力,保证压缩中出现的错误,可以在提取的时候弥补过来,专家们把这叫做“可调节性”,它显然要比“可压缩性”更加艰难。
解决这些问题,正是张亚勤的专长。此人一向标榜与众不同,就连自己智慧和热情的指向,也会发生类似的情形。与大多数中国学生在海外苦读不同,他在美国后来几年的主要经历,其实是放在投资和公司经营上。
又同大多数回到国内投身商海的留学生不同,他回国之后反而能将主要精力用于科研。在1999年,他写了至少20篇论文,多数课题是同他人合作,他自己也全力做了3个。他认为其中最重要的问题是,怎样把多媒体信息同步传输在因特网和无线通讯的架构上。尽管他在世界计算机领域的科研成就首屈一指,但他发现因特网时代出现了一些新问题,就像我们前面的叙述。这使他意识到,无论什么样的研究,最重要的事情是,从开始就想到最503后:压缩的时候想到怎样检索;传输的时候就要想到给谁传输,又怎样再现;公路上很拥挤的时候,你要想到怎样控制,怎样指挥,怎样分配路面和时间。张亚勤说:“这是一个完整过程。每一个环节都要想到,每一个环节都要和别的环节紧密相连。”他为此建造了未来信息科学的新框架。其基本定理是:信息传输速度越快,失真也就越大。这理论在以往的信息科学中叫做“速率…失真论”,并非张亚勤始创,而是克拉德.商农在50年代创建的,它在此后数十年间,成为全世界信息科学的基石。但是,张亚勤在“商农理论”的基础上建筑起来的这座因特网技术大厦,却有着全新的含义。
很显然,张亚勤现在的研究已经覆盖全局。“我在拓展未来。”他说,“原来的研究限制在一个局部,是创作一个配件。现在,情况不一样了。”就连比尔.盖茨也认定,微软公司最优秀的多媒体技术研究员都跑到北京去了。在张亚勤小组中,就有来自美国的李世鹏和李劲。李世鹏主攻“视频压缩”,其要点在于“可调节性”,这比他以往的研究困难百倍。李劲504是“图形的压缩传输”,这东西和沈向洋小组的研究有点像,两者都是“图形”,其实并不一样,沈向洋的问题是怎样获得图形,不问“获得”之后的事情。李劲的问题正是“获得”之后的压缩,既能压得小,又能压得好。
合二而一,恰为一个整体。朱文武在11月加盟微软中国研究院后,其精力集中于“网络资源的分配和变化”,也即因特网上的传输和无线传输。这样,这个小组就在张亚勤之下出现了“李-李-朱”三足鼎立的局面。
尽管张亚勤在“龙苑会议”上很谨慎地宣布,他只有大约60%的把握,但小组里面谁都知道,倘若张宏江小组和沈向洋小组在“死亡线”之前拿出成果,而他们一无所有,那就意味着自己的落后。这种心理上的相互影响,代表了希格玛大厦里各个小组之间无言的竞争。
新办法原来就是“脑筋急转弯”
对于大多数研究员来说,“死亡线”具有一种明显而又奇异的激励作用。其意义,既不同于我们国家通常的“精神文明教育”,也不同于“物质第一”的逻辑。事实上,大多数人把“死亡线”铭刻于心,不辞劳苦,夜以继日,不过是想要赶在别人的前边,把自己喜欢的事情505做完。
夏天开始的时候,张亚勤小组也加快了自己的步伐。
李世鹏拟订了自己的研究框架,但就是缺少人来实现那些得意的想法。幸运的是,暑假里有大批学生到这里来实习,他一下子找来6个学生--2个研究生,4个博士生。这些学生来自哈工大、中国科大、清华大学、普林斯顿大学和华盛顿州立大学。他把他们化整为零,交给他们题目,告诉他们怎样在网络上查阅文献,一起讨论困难所在,还按小时支付酬金。他第一次指挥这么多人,就像一个战场上的将军一样踌躇满志,以为来日必可大获全胜。但他很快就发现,这些学生不能令他满意:自信有余而视野不足,聪明但却封闭,又不具有听取别人意见和理解别人想法的习惯。最要命的是,他们只知道自己“天下第一”,至于其他事情,你说了半天,他根本听不进去。
看来清华大学电子系的潘锦辉是个例外。这女学生天资聪敏,又能老老实实做事。同时兼有这两种品格的年轻人,真是少之有少。李世鹏给她出的题目是:从一个不动的背景中,把一个运动的物体提取出来。她苦思506冥想一个星期后,终于有了办法。按照这办法做了几天,“运动的物体”倒是提取出来了,但却变了形--画面上该有的东西没有了,不该有的东西有了。于是他和她在一起讨论问题的症结,她说她高度怀疑,这种寻找图像之间运动轨迹的方法,过于粗糙:假如我们在这条轨迹上提取的图像不是“2帧”,而是“10帧”,是否能够解决“变形”问题?果然,她很快就成功了。
暑假过去以后,大多数学生要求继续实习,他们有这样好的计算机使用,还有酬金,为什么不愿留下来呢?
但李世鹏把其他人都打发走了,只把潘锦辉留下来。秋天开始的时候,吴枫也来了。吴是哈尔滨工业大学的博士,也是我们国家计算机权威、中科院计算所所长高文的得意门生。按照李世鹏的说法,吴在中国是多媒体数据压缩领域最优秀的人之一。应当说,在技术的领域中,高文的计算所是微软研究院的竞争者,但高和张亚勤的关系特别好。所以也就慷慨地将他的得意门生送到希格玛大厦来。
吴枫的加盟与潘锦辉的成熟,使得李世鹏小组的研究进度一下子加快了不少。到了1月份“死亡线”来临507的时候,他兴高采烈地向李开复报告:“我们这个东西已经到了可以拿出来的程度。”按照张亚勤的判断,李世鹏研究的题目并非开创性的,但他的算法是全新的。
这一成果出现在一个国际会议上的时候,当场引起大家惊叹。“他的想法很巧妙,也很简单,一捅就破。但别人没有想到,他想到了。”张亚勤这样解释。项目的名称挺怪:“MF.MF”。第一个“MF”纯粹属于专业性的,意思是“多帧的”和“多特征的”。第二个“MF”可就有点浪漫色彩,李世鹏叫他“强壮的青蛙”,这是形象地描述了新算法的特色。
概括地说,情形是这样的,让计算机找到运动的东西容易,判断静止的东西困难。比如一个移动的拳头,从这里到那里,计算机将两帧图像加以比较,就知道它在移动并且已经到了哪里。这情景有如夜幕中的青蛙,面前物体不动的时候,它熟视无睹,物体只要一动,它就能够看见。不过,科学家却不能真把计算机当作青蛙,他们不仅要让它跟踪运动的图像,还必须让它找到尚未移动的“第一幅图像”。这居然成了一个世界性的难题,在李世鹏之前,所有科学家都在绞尽脑汁“寻找第一幅”,508结果始终不能令人满意,也就无法跟踪后面的“运动”。
李世鹏的办法,说起来很像“脑筋急转弯”。他说,他根本不用先找“第一幅”,而是先找后面那些已经运动起来的图像,反过来确定“第一幅”。开始的时候,效果并不理想:大约20分钟才能找到那个“第一幅”。但他信心十足,继续改进,结果也日益精进。到最后,居然能够在1秒钟内找到10个“第一幅”。所以他很得意地把自己的算法叫做“强壮的青蛙”。他喜欢他的“青蛙”,所以后来对朋友说的话,带有感情色彩:“当然还有更加成功的人,但我觉得我的时间都没有浪费。我做的东西都是我喜欢的东西。人这一辈子,还要求什么呢!”把精彩的思想变成现实李劲的办公室与李世鹏仅一墙之隔,如前所述,这两个人在来到微软中国研究院之前,都是张亚勤的崇拜者,来到这里之后又都在张亚勤小组共事。两个人在国外全都有着不凡的成就,但在国内,李劲的名声远在李世鹏之上,这一半原因出自他的天资聪明以及大器早成,另外一半原因,则要归功于“计算机娃娃”的美名。当时的“娃娃”,而今无论生理还是性格都已相当成熟。他509身高体胖,不拘小节,接人待物不卑不亢,彬彬有礼,但你会觉得他的礼貌中有一种明显的距离,说话的时候总是不高不低,不紧不慢,不像李世鹏和徐迎庆那样充满激情地谈论过去和今天,也不会像沈向洋那样眉飞色舞地讲述他的稀奇古怪的念头。他总是显出一副公事公办的态度。不过,当他谈到自己的女友时,立即就会有一种发自内心的感情流露出来。由于他本身的能力,更由于他在外界的名声,研究院里所有人都对他抱有无限期望。
李劲对自己的研究成果充满了自信。那是一个漂亮女孩子的巨幅照片,其实际尺寸相当于他眼前这台显示器屏幕的12倍。李劲的目标,就是要在照片的传输过程中,任意选择其中一个部分,优先显示出来,可以是一对漂亮的眼睛,或者是一缕乌黑的头发。按照李劲的表示,这样大的一幅图,用户不需要一下子看到全部。“你要看的部分,就传输过来。不看的部分,就不必传输,就像手里拿着一个放大镜一样。”这是一个“从虚拟到现实,从模糊到清晰,首先选择局部,逐渐扩展至整个画面”的过程。在计算机的世510界中,图片所包含的比特数量,远远超过文字和声音,这给它的传输和储存都带来更多的麻烦。比如我们眼前这个女孩子的照片,其色素数量,原本为15兆,也即相当于1500万比特。经过张亚勤小组的压缩技术处理之后,还有大约64万比特。压缩成效显著,但仍是一个庞大数字。你如果将这整张图从网络下载,即使线路完好,也需要等待漫长的2分40秒