《数字化生存》

下载本书

添加书签

数字化生存- 第12部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
一辙。慢动作的影像差不多是每秒30帧画面(60个扫描场)。由此,与其制造一个能够反映所有视点的全息图像,不如把它做成每英寸上有一个视点而省略掉中间的其他数据的影像。他成功了。
  除此以外,本顿和他的同事们还注意到,我们的空间感在很大程度上是一种水平空间感。由于并列的双眼的视差,而且由于我们的视线总是沿着近平水平的方向移动,因此在我们对空间的感觉中,水平视差比垂直视差(上下的变化)重要得多,水平视差所捕捉的空间信号占了绝大多玖。假如我们的眼睛是一只叠在另一只的上面,或是我们经常在树上爬上爬下,情形或许不同。但事实却非如此。事实上,水平视差对视觉的影响太大了,本顿后来决定根本不去考虑垂直视差的问题。
  因此,媒体实验室所展示的全息影像几乎都没有垂直视差。当我们向来访的人介绍本顿实验室外悬挂的一组全息样品时,他们根本没有注意到这些样品是没有垂直视差的。事实上,一旦我告诉他们这些图像没有垂直视差时,他们都会弯下腰来、再踞起脚尖反复地细看,最后才真的相信。
  空间取样结合水平视差(完全忽略垂直视差)的结果是,在本顿小组的手中,与制造一个全分辨率的全息影像相比,如今只需要:%的电脑计算能力,就能得到这种新的影像。由于这个原因,他们制造出了全世界第一个全彩的、由有深浅明暗变化的形体所构成的实时全息影像。它自由地漂浮在空中,其大小和形状相当于一个茶杯或“矮胖”的莉亚公主。整体大于部分之和
  显示的质量确实不单和视觉有关。它是一种典型地运用了其他感官体验的收视经验。各种感宫构成的整体的确大于部分之和。
  在高清晰度电视刚刚萌芽的时候,当时在媒体实验室工作的社会科学家拉斯。纽曼进行了一个划时代的实验,测试观众对显示质量的反应。他安装了两套一模一样的高清晰度电视和录像机系统,放映一模一样的高质量录像带。不过,他在A组用的是录像机的普通音质和电视机的小扬声器,而在日组中,则使用了很棒的扬声器,可以播放出比CD还要好的音质。
  结果令人吃惊。许多实验对象报告说日组的图像清晰得多。事实上,两组影像的品质完全一样。但B组的收视经验却好得多。我们倾向于把感官经验作为一个整体来加以判断,而不是根据各个部分的经验来加以判断。虚拟现实系统在设计上有时忽略了这个重要的观察结果。
  在设计军事坦克训练器的时候,人们花了很多心血,来达到最高的显示质量(几乎不计任何代价),希望获得的效果是,当你注视显示器的时候,几乎就和从坦克的小窗口看出去一样。这个想法挺好,但在不断增加扫描线数目上进行了艰苦卓绝的努力之后,设计师才想到可以引入一种价格低廉、会稍稍震动的运动平“台。设计师又在此基础上增加了一些额外的感官效果——坦克的马达声和轧过地面的声音棗结果整体感觉十分逼真,设计师因此可以减少扫描线的数目,而不会影响整体视觉效果。无论如何,这个系统看起来和感觉起来很真实,已经超过了原来的要求。
  经常有人间我,为什么我吃东西的时候要戴着眼镜,因为我显然不需要眼镜,也能看得见食物和刀叉。我的回答很简单,当我戴着眼镜的时候,食物显得更加美味可口。能够清楚地看见食物是饭菜质量的一部分。
  “看”和“感觉”相得益彰。
4、看和感觉让电脑看得见
  跟装了传感器(sensor)的现代盥洗室或户外泛光灯比起来,个人电脑对人的存在的感觉真是迟钝。便宜的自动对焦相机要比任何终端或计算系统都更清楚面前的景象,因而拥有比电脑更高的智能。
  当你从电脑键盘上抬起手来的时候,键盘不知道你是因为思考而暂停、是自然的休息,还是跑出去吃午饭了。它分辨不出是在和你一个人讲话,还是它面前还站着另外6个人。它也不知道你究竟是穿着晚装或宴会装,还是一丝不挂。因为如此,所以当它正在屏幕上显示重要信息时,你可能正好背对着它;或是当它正在和你说话时,你可能正好走开,根本没听见。
  我们今天的着眼点完全放在如何使电脑更容易为人使用上。也许现在是问这样一个问题的时候了:怎样才能使电脑更容易与人相处?打个比方,假如你不知道谈话对象究竟在不在场,你怎么和他们讨论事情呢?你看不见他们,不知道他们共有多少人。他们面带笑容吗?他们到底有没有集中注意力听你讲话呢?我们充满渴望地谈论人机互动和对话系统,然而我们却存心把参与对话的一方留在黑暗中。
  现在是该让电脑看得见、也听得见的时候了。读你干遍也不厌倦
  关于电脑视觉的研究和应用长期以来几乎完全是针对情景分析的。这种情景分析尤其用于军事上的目的,如无人驾驶车辆和智能炸弹。电脑在外层空间的应用也带动了科技的最新发展。假如你让一个机器人在月球上漫游,机器人只是把看到的影像传给地球上的操作人员还不够,因为即使用光速来传输,需要的时间仍然太长。假如机器人走到了悬崖边,等到人类操作员看到录像中出现悬崖,赶忙把口信传到月球上,叫机器人别再往前走时,机器人早就已经掉下去了。这只是情景分析的一个例子。在这种情况下,机器人必须根据它所看到的情景,自己下判断。
  科学家不但越来越了解影像,并且已经开发出一些技术,比如说,能从明暗度推测形状,或把物体从背景中抽离出来。但是直到最近,科学家才开始审视电脑对人的识别能力,以改进人机界面。事实上,你的脸就是你的显示设备,电脑应该能够读取它。因此,它必须能辨认你的脸以及你独特的表情。
  我们的表情和我们想要表达的内容息息相关。通电话的时候,我们不会因为电话线另一端的人看不到我们,就面无表情。事实上,有时候为了加强口语的分量和语气,我们会更多地调动脸部的肌肉,并伴有更夸张的手势。电脑可以通过感应我们的表情,接收到繁复而且并行的信号,因此令我们的口语和文字讯息都更加丰富。
  使电脑能够辨认人的脸部和表情,这是一个令人生畏的技术挑战。尽管如此,在某些情况下,这一点还是完全可以实现的。在你和电脑一对一的情况下,电脑只需要知道操作电脑的人是不是你,确定坐在它面前的不是地球上任何其他人就够了。此外,把人从背景中分离出来也十分容易。
  很可能在不久的将来,电脑就能看到你。1990年至1991年,海湾战争爆发之时,许多商务旅行都被禁止,因此电信会议大量增加。此后,越来越多的个人电脑都配置了价格低廉的电信会议设备。
  电信会议的硬件包括一个架设在显示器上方中央的电视摄像头,以及能编码、解码和实时地把影像全部或部分地显示在电脑屏幕上的硬件和软件。个人电脑将会越来越充分地为影像通信做好充分准备,当初电信会议系统的设计者们并没有想到要把摄像头用在个人电脑上,让我们享受到面对面的电脑通信。但是,这又何妨呢?人鼠之间
  我们媒体实验室的尼尔。葛森菲尔德做过一个很有趣的研究:比较只要花几分钟便可学会、价值30美元的鼠标,和要花一辈子才能精通、价值3
  美元的大提琴弓。他对照了16种运弓技巧和单击鼠标、双击鼠标和拖曳鼠标的动作。大提琴的弓是为音乐巨匠设计的,而鼠标则是给你我这种人设计的。
  就图形输入而言,鼠标是简单而又累赘的媒介。使用鼠标有4个步骤:1)摸索寻找鼠标;2)晃动鼠标以找到光标;3)把光标移动到你希望的位置;4)单击或双击鼠标按钮。苹果“强力笔记本”电脑的创新设计至少把这些步骤简化为3个,并且采用了一个“静止鼠标”(最近又改成了“跟踪板”),可以随手指移动,因此使打字时所受的干扰减少到最低程度。
  画图的时候,鼠标和跟踪球就一筹莫展了。不信你试着用跟踪球来签签名看。在这种时候,用“数据板”是个好得多的办法,也就是用像圆珠笔一样的笔尖,在一个平滑的表面上操作。
  配置了绘图数据板的电脑并不多,而那些配置了数据板的电脑又仿佛患了精神分裂症一般,不知道该怎样安置数据板和键盘的位置才合适,因为两者最好都直接摆在显示器下方的中央位置。解决冲突的方式通常都是把键盘放在显示器下方,因为大多数人(连我也在内)根本不碰图案。
  结果,数据板和鼠标都被摆在旁边,我们必须学会某种不大自然的手、眼协调方式。你一边在下面操作数据板或鼠标,一边用眼睛盯住屏幕;也就是说,我们是靠碰触来作画的。光笔与数据扳
  鼠标是道格拉斯。恩格巴特在1964年发明的。当初他设计鼠标是为了指点文件,而不是作画。但是这个发明却流传下来,而且今天随处可见。美国国家艺术基金会主席简。亚历山大最近开玩笑说,只有男人才会想到把它叫做鼠标。
  在她说这番话一年以前,伊凡。苏泽兰完善了直接用光笔在屏幕上作画的概念(50年代,其防空系统曾使用过一些粗糙的光笔)。苏泽兰的方法是:跟踪由5个光点构成的十字形光标。要停止绘图,只要抖一下手腕,退出跟踪就可以了。这是个精巧、但不太精确的终止画线的方式。
  今天,光笔事实上已经踪影全无。因为把手举在屏幕前是一回事(且不说当血液顺着手掌不停地往下流时,要长时间保持这个姿势已经十分辛苦了),而拿着一管和电脑拴在一起的、两盎斯重的笔,更会令手掌和手臂异常疲劳。有些光笔的直径达半英寸,用的时候感觉就好像夹着雪前写明信片一样。
  在数据板上画起图来则格外舒服,而且只要多费点心思设计,笔尖也能产生出如艺术家画笔一样的质感和丰富效果。到目前为止,数据板通常让人感觉好像是用圆珠笔在一块平滑而坚硬的板上作画,因此必须在桌面上靠近你和显示器的地方,为这块板找个安身之处。既然我们的桌上已经堆满了东西,如果要让数据板流行起来,唯一的办法是家具制造商把数据板直接做进桌面里,这样一来,就没有单独的数据板了,只有桌子本身。你的眼睛会说话
  设想一下一面读着电脑屏幕上的文字,一面问:那是什么意思?她是谁?我怎么到了那个地方?问题中的“那”、“她”和“那个地方”是由当时你眼睛注视的方向决定的。这些问题牵涉到你的眼睛和文件的接触点。我们通常都不把眼睛当作输出装置,但我们却总是以眼睛来输出信息。
  人类能够觉察彼此目光的方向,并且进行视线的交流,这种本领当真神奇不已。想象一下,站在20英尺以外的一个人有时候直视你的眼睛,有时目光却从你肩膀的上方穿过,注视着远方。使此人目光注视的方向和你的视线只有不到一度的差距,你也能立刻感觉到其中的差异。这究竟是怎么回事呢?
  你当然不是用三角学的方法算出来的,换句话说,并不是计算另外一个人的视线是否与你的视线相交。不,其中另有溪跷。你的眼睛和那人的眼睛之间一定传递了一个讯息,但我们还不清楚个中奥妙。跟踪眼球的运动
  总之,我们总是用眼睛来指示物体,当有人问你,某某人到哪里去了,你的回答可能只是注视着敞开的房门。当你说明要带什么东西时,可能会盯着一个旅行箱,而不是另一个。这种视线的指示,加上头部的动作,可以是非常有力的沟通渠道。
  今天,已经有一些技术可以跟踪眼睛的运动。我最早看到的一种技术,是戴在头上的眼球跟踪器(eyetracker)。当你读文件内容时,跟踪器会把屏幕上的文字从英文变成法文。当你的中心视线不断地从一个字移到另一个字的时候,你看到的每个字都是法文,于是整个屏幕看起来是百分之百的法文。但是,眼球没有被跟踪的旁观者看到的屏幕,却大约99%都是英文(也就是说,除了戴着跟踪器的那个人正在看的字是法文外,其他的字都是英文)。
  更现代的眼球跟踪系统则采用远距离电视摄像头,因此用户不需要戴任何装置。能显像的电信会议配置尤其适合进行眼球跟踪,因为用户往往隔着相对固定的距离坐在屏幕前面,而且你通常都会注视着和你进行远端通信的那个人的眼睛(电脑会知道眼睛的位置)。
  电脑越清楚你的位置、姿势和眼睛的特点,就越容易掌握你注视的方向。具有讽刺意味的是,这种利用眼睛作为输入装置的异乎寻常的媒介可能最先应用在一个平淡无奇的结构中,即坐在电脑桌前的人身上。
  当然,如果你把眼睛(看)和另外一种输入工具——嘴巴(说)同时使用,效果会更好。
5、咱们能不能聊聊弦外之音
  对于大多数人而言,打字并不是一种理想的界面。假如我们能和电脑说话,那么即使是最坚定的反机器分子,大概也会以更大的热情来使用电脑。但是,目前的电脑仍然又聋又哑。这究竟是为什么呢?
  电脑在语音识别方面一直没有多大的进展,主要原因不在于缺乏技术,而在于缺乏眼光。每当我在语音识别的成果展示会或产品广告中,看到人们拿着麦克风说话时,我都很奇怪:难道他们真的忘了,说话最大的价值之一就在于能让双手空出来做别的事情吗?当我看到人们把脸贴近屏幕讲话时,我也很奇怪:难道他们忘了,能够遥控是使用声音的原因之一吗?而当我听到人们要求设计出能够识别出各个独立用户的语音系统时,我问自己:他们是不是忘了,我们是在和个人电脑说话,而不是在和公用电脑说话?为什么似乎每个人解决问题的着眼点都落在错误的方面呢?
  原因很简单。直到最近,我们一直被两个带有误导性的观念所驱使。第一个观念是受到老式电话通信系统的影响,希望任何人在任何地方都能拿起话筒对电脑发号施令,而不需要和接线员对话,而且不管说话的人怎样南腔北调都无关紧要。另外一个挥之不去的想法来自于办公自动化——我们希望有一种会说话的打字机,我们对着它一口气不停他说,它能一字不差地把我们的口述转化成文字记录下来。由于大家一直只把注意力放在这两个方面,使我们拖延多年,始终无法实现一些更容易实现的(同时也是有用的)目标,即让电脑在高度个人化而且互动的环境中,识别并了解对话内容。
  我们也忽略了说话在文字以外的价值。举例来说,今天的电脑需要人全神贯注。你通常都必须正襟危坐,同时把注意力放在互动的过程和互动的内容上。在走来走去时使用电脑,或在有多组对话时让它参与其中的一组,简直是不可能的。语音识别可以改变这一切。
  能够在一臂远的距离之外使用电脑,是非常重要的事情。想象一下,假如你和别人说话的时候,他、她的鼻子尖老是凑到你的脸上,那是什么感觉!我们通常都隔着一定的距离与别人讲话,偶尔还会转过身去同时做些别的事情。甚至有时已经走到别的地方而互相看不见了,还在说着话。这种情况屡见不鲜。我希望有一部在“听力范围”之内的电脑,它必须能把说话的声音和周围的杂音(例如空调或
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架