,初敏致力于将各种机器学习和数据挖掘技术用于大规模数据的分布式计算。工作之余,她最大兴趣是游山玩水,希望有生之年能走遍祖国的山山水水和世界的角角落落。
电子书 分享网站
TechFest:我们的技术节 谢幸(1)
最近流行一个词叫做创意市集,其组织形式和普通市集基本相同,最大不同之处就在于“创意”。在这里,每个摊主都是设计者,摊位上的每件物品都是他们亲手设计制作的,独一无二,具有独特的创意与强烈的个人风格。他们来创意市集的目的不只是为推销个人的作品,更重要的是,这里是一个设计者之间、设计者与爱好者之间沟通的平台。一群志同道合者们在这里聚集,聊得兴高采烈,海阔天空。
其实,在Microsoft,也有这样一个“创意市集”,那就是一年一度的技术节!
你一定不会相信。
技术节,粗看上去,不过就是各自说说自己的工作成果,不过就是很多人聚集在一起,各自show自己的demo而已,有什么特别的呢?
我以前也是这么想的。这要从2002年2月说起。
半夜的电话
2002年2月的一天,北京,凌晨两三点。电话铃声突然响起,我从床上一跃而起,直觉告诉我,一定是演示出麻烦了。
其实,严格说起来,我并没有真正“参加”这次的技术节,我的任务是留守北京负责后方监控。这时的我来微软工作还不满一年,技术节,对我来说,不过是个模糊的概念。这次我们组的demo之一是把网络视频转换成适合手机屏幕显示的格式,虽然之前我们对其进行了严格调试,力求不出任何问题,可意外还是发生了。这也许就是所谓的墨菲定律 (Murphy’s Law),担心什么就有可能发生什么,不论平时准备的多好,你的技术总是会在给最多人演示的时候出问题。
整个演示需要多台服务器之间进行配合,用手机来播放最终的结果,代理服务器接收视频,对其进行分析、处理和转换,还有一台服务器专门负责发送视频流。由于用到的机器数量比较多,其中一部分还位于中国。在现场安装设置过程中,任何一个微小的错误都可能会导致整个demo不能工作。通过电话,我和远在美国的同事们一点点排查,一遍遍调试,最终保证了演示的顺利进行。
背下来的讲稿
2003年,西雅图。我终于有了与技术节亲密接触的机会。
由于这也是我第一次去美国,语言交流成了我们这些年轻员工最担心的问题。为了防止可能出现的尴尬场面,我用了一个笨方法,把演示的内容背下来。于是,我事先准备好一份详细的讲稿,并找来英文水平好的同事修改润色,每句话都经过仔细推敲。定稿后反复朗读,牢记于心。此外,我还花费很多时间精心设计了海报,虽然现在看来,它显得那么稚嫩朴素。直到现在,这张海报还悬挂在我的办公室墙上,记录着当年的历史。
准备好这些,我终于有足够的信心站在演示台前。虽然我来之前对技术节有过很多设想,可现场看到如此热闹的场景依然让我兴奋不已。来观看的都是公司各部门的同事,大家在会场中往来穿梭,自由选择感兴趣的展示,而每一个展示者也都乐于与大家分享自己的技术。
展示者在台前兴奋的说,观看者在周围投入的听,并不时提出疑问或新的想法。产品组的项目经理们也会到现场观看,并借机寻找是否有相关技术可供合作。两天的技术节里,我一直积极认真地做着每一次演示,虽然辛苦,却很兴奋。有很多观众被我们的展示所吸引,这也让初次参加的我很有成就感。
这次美国之行,我还见到了在微软总部工作的几个本科同学。因为大部分时间观众都很多,为了不打扰我,他们特意等在一旁,直到我做完演示才过来打招呼。他们夸赞我说,没想到你第一次来美国英文就这么好。我听了暗自得意,他们哪里知道我全部是背下来的呢。这次技术节之后,我已经不再需要提前背诵讲稿了,可是这段经历却让我一直记忆犹新。
在做完演示的空暇我会在会场四处走走,参观其他研究员的展台。我发现有很多研究员非常认真,甚至是一些资深研究员们也都一直坚守在展台前演示自己的项目,不管我何时经过,都看到他们有着饱满的热情,我可以感受到他们对研究的热爱,而这份热爱和年龄与职位都没有关系。他们身上所展现出的激情与创造力让我深受感染。
我心目中对技术节的看法也因此一点点地改变了。
TechFest:我们的技术节 谢幸(2)
我见到了鲍尔默
鲍尔默,那个听说会在公司年会上骑马冲上台的CEO,我曾在公司的内部视频上看过他充满激情的演讲片段,但我从未想到有一天我能站在他的面前演示我的demo。
可技术节就是这样一个让人梦想成真的地方!
2006年3月2日,我激动而忐忑的等待在展台前。
鲍尔默在两三个人的陪同下来了。没有前呼后拥,和普通的观众并没有太大不同,他很随和的拉过一把椅子,坐在了我面前。
我要给鲍尔默做的演示是photo2search,其内容是用户用手机拍下照片,把照片上传到服务器并匹配与之最相似的图片,从而得到和照片拍摄内容相关的信息。举个实际中的例子来说吧,你用手机拍下路边某餐馆,系统将该照片和其他图片进行分析匹配后,便能够知道该餐馆的名字,还可以将餐馆的优惠活动,甚至当天特价菜品等信息发送到你的手机上。你只需摁了几下手指,便很方便的得到了想要的信息。
演示中,我输入预先准备的查询图片——这是一张天安门的照片,系统立即返回了数据库中所有和天安门相关的图片。鲍尔默很快便理解了这项技术的主要功能,非常兴奋的谈起了他的看法,包括潜在的商业用途,微软哪些产品中可以运用该技术等等。他敏锐的眼光和独到的观点让我非常佩服,也让我看到了这项技术的美好前景,增强了把研究转变为现实的信心。
这次技术节上,我还注意到一些有趣的细节。为了了解什么样的演示最受欢迎,组织者在每个展台前放上了一台刷卡机,你如果对某项技术感兴趣,就在该刷卡机上刷下自己的门卡,以此作为最后的人数统计,并且会在技术节结束后把你看过的所有演示信息通过email给你。另外,会场内还装备了一台大屏幕,实时显示着每个演示的刷卡数。
于是,一个有意思的场景出现了,研究员们休息时便三三两两的端着咖啡,到这里来看自己的排名情况。也因此出现了排名之争,继而衍生出各种各样提高排名的方法。比如,有人会费尽心思将自己的展区布置成小型电影院的模样,还有人准备了小礼品以“贿赂”参观者。我们一边学习别人布置展台的经验一边也想了很多方法,租了大屏幕显示器,并请专业设计师设计了精美的海报,这一切都是为了吸引更多的眼球。努力终归没有白费,第二年,也就是2007年,在所有来自中国的演示项目中,我们拿到了刷卡量第一!
上CNN了
技术节的第一天叫做Public Day,即“公开日”。这是面对媒体的宣传活动,并会邀请一些学校的教授和其他公司的高层前来参加。公司会从参加技术节的所有Demo中挑选出一些参加Public Day上的公开演示。
2007年,我的项目被选中参加Public Day。这对我来说是更大的考验,意味着不能出任何的差错,意味着将要面对记者的采访,当然也意味着会有更多的人关注我们的项目。
今年的演示延续了上一年的工作,即用手机拍摄照片来进行搜索,但这次不仅可以支持更大规模的数据库,返回的结果也有了很大改进。在这次演示里,我们使用了百万量级的图片数据,基本上可以覆盖一个城市的大部分区域。虽然数据规模更大了,但是系统的查询时间并没有增加,基本上在几秒内就可以得到结果,在手机使用中这已经是可以接受的性能。性能提高的主要原因是我们使用了分布式的系统来处理查询,极大地提高了系统的可扩展性。
(谢幸在2007年微软技术节上向观众做Photo2Search演示)
Public Day那天,CNN、BBC、Seattle Times (《西雅图时报》)、路透社等各大媒体都派出了记者参加,也能看到来自中国的记者,如《计算机世界》、《互联网周刊》等等。通常记者的采访是这样的:一人负责拍摄,另一个人手持话筒,边看演示边提问题。整个采访过程时间并不长,这就需要我必须在很短的时间内,既让他们看懂演示的技术,又要把其中的关键点讲述得简洁清楚。就这样,记者走了一拨又来一拨,一天下来,我已经记不清楚我接待了多少位记者、做了多少遍演示。
第二天,我刚打开邮箱就发现同学给我发的Email,“你上CNN了!”我很惊讶,连忙打开CNN的网页,赫然发现我做演示的照片出现在当日科技版的头条新闻里,标题是“TechFest Explores Future Technologies”。新闻里这样写到:“Lost in Seattle with nothing but a camera phone? Just snap a picture of a nearby building; send off the photo to a database and soon you'll get back a map and information about where you are。 (在西雅图走失了?什么都没有,随身只剩下一个可拍照的手机?没关系,只要拍下一张周围建筑物的照片,把它传到数据库,一回你就能得到你所在地的地图和信息了)” 我的经理马维英看后开玩笑的对我说,很多人千方百计想上CNN还上不了呢。随后,沈向洋院长也写信来打趣我说“你看起来很帅!”技术节一结束,我立即将这些报道转发给为了这个演示一起努力工作的同事和学生,让他们和我一起分享这份喜悦。
2008年3月,西雅图春寒料峭,我和我的同事们又一次来到了技术节,又一次拿到了中国参演项目中的点击量冠军。
我们是一群科学顽童
现在再回头说说,为什么说技术节就好像是一个全公司的创意市集呢?
细细比较起来,两者还是有诸多相似之处的。每个参加技术节的研究员们就好像市集上的摊主,每个展位就是他们的“摊位”;市集上的摊主们出售的是自己的看家宝贝,研究员们展出的是自己引以为豪的技术;正如摊主们的主要目的不是为卖出商品一样,研究员们参加技术节也不只是为了做秀或扩大知名度,促使他们来到这里的动力主要是源于对技术本身的热爱与激情。正是由于这种热爱与激情,使得这里没有年龄的差异,没有级别的高低,这里只有一群热衷于科学的顽童,每一次的脑力激荡中总会闪现灵感的火花。
费曼说,科学是很好玩的游戏。这句话改变了很多人对科学的刻板态度。同样的,技术节也改变了我做研究的态度,研究也应该是很好玩的游戏,只有对事物保持好奇、怀疑、钻研、动手实验的态度,只有保持一颗具有创造力与激情的心灵,只有把自己的技术看作犹如自己孩子般的热爱,才能在做研究中享受创造的乐趣,才有可能体会到成功的兴奋与喜悦。
每一次的技术节,我都被这种气氛感染着,也在这个环境里成长着。从第一张朴素到不起眼的自画海报,到现在的借助专业设计;从第一次的通篇背诵讲稿,到现在的交流自如侃侃而谈;从刚开始站在展台上的紧张不安,到现在面对记者时的成熟老练……是一年又一年的技术节造就并见证了这一切。
作者介绍:
谢幸,江西南昌人,15岁离家,求学于中国科大少年班。自认既非英雄,亦非神童,然勤能补拙,并幸得良师。24岁博士毕业,加盟微软亚洲研究院,于互联网搜索组任研究员,发表论文数十篇。忙里偷闲间,尤喜阅读与收集,平日里流连方寸,神游书海,乐此不疲。偶能偷得几日浮生,寄情山水,实为平生快事也。
。。
微软对联背后的故事 周明(1)
微软对联系统第二版在2008年春节之前10天终于上线了。我非常高兴地看到经过自然语言祖和创新工程组的同事们半年多的努力,网站以一个崭新的界面加上一个水平更高的对联系统 带给用户更加美好的体验。我非常喜欢创新工程组同事邹放设计的漂亮的界面,有两个大红灯笼,灯笼下面垂挂着两行对联:
新年纳余庆,嘉节号长春
据说这是中国最早的一幅对联,是五代的后蜀的国王孟昶写的。从那时候起,对联就逐渐开始流行了,成为中国文化的最典型的代表。为了配合上线,在微软亚洲研究院的博客上,蒋龙在公共关系组的同事葛瑜的帮助下,投放了一篇“看计算机‘舞文弄墨’”的博客 。
虽然我们并没有做任何商业宣传,但是上线当日就创造了单日独立访问人数5万人次、每日页面浏览量达50万的“票房纪录”。许多人发帖,呼吁大家使用这个新奇的软件。在百度搜索一下“微软对联”,一下子就达到93万的记录。这对于一个研究项目来讲,似乎是一个奇迹。
用户通过微软对联系统,似乎在进行一次穿越中国文化的发现之旅,找寻中国文化渗透到每一个汉字,每一个词,甚至每一个笔画上面的千年沉淀。又似乎在跟电脑的默契配合,体现互联网时代每一台计算机背后的骨子里的一点点的创新、少许的幽默和对时弊的愤世嫉俗。
我无聊的时候,总是爱到网上去看看有没有什么有趣的评语。这就像看着自己的孩子一天天地长大。下面摘录两则我看到的比较有意思的评论。
评论一:
“微软研究院的这套对联机真的是很好很强大,那天是在大旗网外链的一个论坛上看到的,帖子很热,人气很旺,从上到下认真的看完每个对联之后,对微软的这套对联系统那真是佩服的五体投地。
咱们可以先看看饱受好评的几个对联:上联:毛林周刘华邓江胡,下联:秦汉晋隋唐宋元清,横批:震古烁今;上联:物价并不高,下联:市场已经远,横批:对酒当歌。
评论二:
我也从来没有在家门贴春联的习惯,但是老爸喜爱书法艺术,也略有小成,用着这套好玩的微软对联机,心想:赶着春节将至,不如编个春联让老爸写写,也蛮热闹喜庆的,即成上联:木土杜家喜迎吉祥鼠,对联机略做运算即成下联:车干轩户春接富贵人,横批:骏业顺风。”
我常常在思考,这个微软对联系统究竟有什么值得总结的地方。看到微软对联,再看到这么多网上的评论,我的脑海里就总象在放电影一样,把这个历程里出现的人物和有趣的事情一幕一幕地闪现出来。值此微软研究院十周年之际,我想确实应该趁现在记忆还清晰的时候,把这段历史好好地总结一下,以便让十年、二十年之后的人们还能够看到曾经发生的有趣的故事。
誓与李敖比高低
微软对联这个项目,跟前任院长沈向洋大有渊源。此事说来有点话长了。
2004年底的时候,沈向洋把我叫去,说搞个自动对联吧。所谓自动对联,就是说人出上联,由计算机对出下联。他之前跟几个人都聊过这个设想,所有的人都告诉他别想了,不可能做出来。他失望,不甘心,反复提起来。“反正你是院长,你说做就做吧。”大家说。有点像傣族的泼水节,泼的都是冷水。