八喜电子书 > 经管其他电子书 > 数字化生存 >

第15部分

数字化生存-第15部分

小说: 数字化生存 字数: 每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



松,而系统的表现也突飞猛进。
    这个观念体现了两点重要的意义:第一,并非所有的发音都需要有字面上的意义,
在沟通中才有价值;第二,有些声音纯粹只是对话中的礼仪。当你接电话的时候,没有
以适当的间隔对来话人说“嗯”,来话人会变得很紧张,而且最终会探问:“喂,你在
听吗?”“啊哈”或“嗯”的意思不是“是”、“否”或“也许”它基本上是在传达一
个比特的信息:“我在这里”。并行的表达
    想象一下这样的情景:你和一群人围坐在一张桌子旁,同桌的人除了你以外都说法
语。你只在中学粗粗修过一年蹩脚的法语、突然有个人转过头来对你说:“还要来点几
酒吗?”你完全听懂了。接着,这个人把话锋一转,谈起法国的政治来了。除非你能说
流利的法语,否则就跟听外星人讲话一样(而且即便你法文流利,也不一定能懂)。
    你可能会想:“还要来点儿酒吗?”是小孩都听得懂的简单法文,而政治就需要更
精深的语言技巧了。不错,但这并不是两段对话的重要区别所在。
    当有人间你要不要添一点酒的时候,他可能正伸长了手臂去拿酒瓶,眼睛也正注视
着你的空酒杯。也就是说,你正在解码的信息并不只是声音而已,而是并行而累赘的多
重信息。而且,所有的主体和客体都处于同一时空。这种种条件同时作用的结果才使你
能听懂他的意思。
    我要重申,累赘是件好事。并行信道(手势、眼神和谈话)的使用是人类沟通的核
心。人类自然而然地倾向于使用并行的表达方式。假如你只会讲一点点意大利语,和意
大利人通电话将会非常辛苦。但当你住进一家意大利旅馆,发现房间里没有香皂时,你
不会拿起电话,而会直接下楼,走到前台值班员那里,拿出你在语言速成学校学会的所
有看家本领,让他拿香皂给你,你甚至一边说一边还会做几个洗澡的动作。
    身在异地时,我们会用尽一切办法,来传达我们的意图,并且解读所有相关信号,
力求索解出哪怕一丁点意思。电脑正是身处这样的异地——人类的土地上。让电脑开口
    要电脑说话,有两种方式:重放先前录下的声音,或合成字母、音节或(最可能的
是)音素的声音。两种方式各有利弊。让电脑说话和音乐的制作一样,你可以把声音存
储下来(就像CD一样),然后重播,也可以采用合成的方式,根据曲调,重制音乐(就
像音乐家一样)。
    重述先前存储的说话内容,也就回到了听起来最“自然”的口、耳沟通方式,尤其
是当我们存储的是一个完整的讯息时,就更显得如此。由于这个原因,大多数的电话留
言都是以这种方式录制的。当你试图把录好的片段声音或个别单字拼凑起来的时候,结
果就比较不如人意了,因为整体的韵律不见了。
    过去,人们不大愿意用预录的谈话来作人机界面,因为这样会消耗电脑大多的存储
容量。今天,它已经不太成问题了。
    真正的问题也正是最明显的问题。你必须提前把话录下来,才能运用预录的谈话。
假如你期望电脑说话的时候,不要把名字弄错,那么你就得先把那些名字存储起来。存
储好的声音不能适用于随机的讲话。由于这个原因,人们使用了第二种方式——合成。
    语音合成器会根据一些规则,把一串文字的内容逐字念出来(就跟你念这句话时没
什么两样)。每一种语言都有所不同,因而合成的难易度也不尽相同。
    英语是最难合成的语言之一,因为我们以一种奇怪而且似乎不合逻辑的方式来书写
英文。其他一些语言,例如土耳其语,就容易多了。事实上,要合成土耳其语非常容易,
因为基马尔在1929年把土耳其语从使用阿拉伯字母改为使用拉丁字母,这样转换的结果,
使声音和字母之间形成了一一对应,每个字母都发音:没有不发音的字母或令人困惑的
复合元音;因此,在单字的层次上,土耳其语简直令电脑语音合成器的美梦成真。
    即使机器能够发出每一个和任何一个单字的音,还有别的问题。把合成的字音集合
起来,在词组或句子的层次上,加上整体的节奏和语气,是非常困难的事情。然而这样
做非常重要,不仅能让电脑说的话好听,而且还能根据说话的内容和意图表现出不同的
色彩、表情和语调。否则,电脑发出来的声音就好像醉酒的瑞典人在喃喃自语一样单调
得让人倒胃口。
    我们现在开始看到(听到)有些系统正把语音合成和声音存储两种方式结合在一起,
随着数字化越来越普遍,最终的解决方案将是两者合一。小型化的趋势
    在下一个千年里,我们会发现我们和机器说的话,与我们和人类说的话一样多,或
甚至比跟人类说的话还要多。和没有生命的物体说话时,人们最感困扰的似乎是自我意
识问题。我们跟狗和金丝雀讲话的时候,觉得非常自在,但是和门把手或灯柱说话,就
会觉得怪怪的(除非你烂醉如泥)。难道我和烤箱说话的时候会不觉得傻乎乎吗?大概
跟对着电话应答机讲话半斤八两吧。
    小型化(miniaturization)的趋势将使今天的语音输入比过去更遍及于每一个角落。
电脑正变得越来越小,昨天还占据了整个房间的电脑设备,今天已出现在你的桌面上,
明天你更可以把袖珍型电脑戴在手腕上。
    许多桌上型电脑用户都不能充分认识过去10年来电脑体积的缩小幅度,原因是电脑
体积的变化包含不同的方面,例如键盘的尺寸仍然尽可能保持不变,而显示器反而变大
了。因此,今天桌上型电脑的整体大小仍和15年前的苹果型机不相上下。
    如果你已有很长时间未曾使用调制解调器,调制解调器大小的变化更足以说明真正
的变化有多大。不到15年以前,一个速率1200波特的调制解调器(价格约1000美元)几
乎像一个侧躺的烤箱一样大。当时,速率9600波特的调制解调器就像一个放在架子上的
大铁笼子一样。然而到了今天,你可以在一块智能卡上找到速率为19200波特的调制解调
器。即使已经把调制解调器做成倍用卡般大小,我们仍然有许多空间没有好好利用,现
在的设计有相当部分纯粹是为了外型的缘故(为了填满插口,或是大得让我们能握住,
而不会随便弄丢)。我们所以没有把像调制解调器这样的东西装在“大头针头”上,主
要不是技术上的原因,而是因为我们很容易把大头针随手乱放,再找起来很困难。
    一旦挣脱了手指张开幅度的束缚(手指张开的幅度决定了一个舒适合用的键盘的形
状和大小),电脑的大小就会更多地受到衣兜、钱夹、手表、圆珠笔和其他类似物品的
体积的影响。在这种种形式中,信用卡很接近我们想要的最小尺寸,显示器很小,因此
图形用户界面变得没有多少意义了。
    笔形的系统很可能被视为笨拙的过渡期工具,既太大,又太小。按钮式的设计也不
理想。看看你的电视机和录像机遥控器,你就会明白按钮的局限所在:按钮式装置完全
是为手指纤细、眼力极佳的年轻人设计的。
    由于以上种种原因,小型化的趋势必然会推动语音制造和语音识别技术的提高,并
促使语音识别成为附在小型物体上的电脑的占支配地位的人机界面。实际的语音识别系
统不需要一定装在袖扣和表链中。小型装备可以通过通信而提供帮助。关键在于,小型
化了以后,就必须靠声音驱动。打电话,传心曲
    很多年以前,霍尔马克卡片公司(Hallmarkcards)开发部的主任告诉我,他们公司
主要的竞争对手是AT&T。“打电话,传心曲”的广告词说的是,透过声音,传达感情。
声音的渠道不仅传递了信号,同时也传递了所有伴之而来的理解、深思、同情或宽容。
我们会说,某人“听上去”很诚实,这个论点“听起来”不怎么可靠,或某件事“听起
来”不像那么回事。声音中潜藏了能唤起感觉的信息。
    同“打电话、传心曲”一样,我们会发现我们也将能通过声音把我们的希望传达给
机器。有些人会表现得像教官一样未教导他们的电脑,另一些人则会用理性的声音。说
话和授权密不可分。你会不会对七个小矮人发号施令呢?
    有可能的。20年后,你可能对着桌上一群八英寸高的全息式助理说话。这种预想一
点也不牵强。可以肯定的是,声音将会成为你和你的界面代理人之间最主要的沟通渠道。




        


北极星书库|| ebook007/ 6、少就是多老练的英国管家



    1980年12月,魏思纳和我在鹿内信隆(《产经新闻》、富士电视台前会长)可爱的
乡间别墅作客。别墅位于日本的箱根地区,离富士山不远。我们深信,参与媒体实验室
的创建将使鹿内先生的报纸和电视传媒王国获益良多,因此他会乐于资助媒体实验室的
创办。我们更进而相信,鹿内先生个人对现代艺术的兴趣,将和我们试图融合科技与艺
术表现、把新发明与对新媒体的创造性应用结合在一起的梦想不谋而合。
    晚餐前,我们一边散步,一边欣赏鹿内先生著名的户外艺术收藏,这里在白天是箱
根露天美术馆。当我们与鹿内夫妇一起共进晚餐时,鹿内先生的私人男秘书也在一旁陪
同。鹿内先生对英文一窍不通,他的秘书却能说一口漂亮的英语,在我们的沟通中担任
重要的角色。魏思纳先打开话头,说他对卡尔德的作品很有兴趣,然后介绍了麻省理工
学院和他自己与这位大艺术家的渊源。秘书听完整个故事后,再从头到尾用日文翻译一
遍,鹿内先生仔细聆听。最后,鹿内先生沉吟片刻,然后抬起头来,看着我们,好像幕
府将军一样发出“喔——”的声音。
    秘书于是翻译道:“鹿内先生说,他也很欣赏卡尔德的作品,他最近买到的作品是
在……”且慢,鹿内先生说过这些话吗?
    整个晚餐中,这样的情形一再出现。魏思纳先说几句话,秘书把它全部译成日文,
鹿内先生的回答差不多都是千篇一律的“喔喔——”,但秘书却有办法译出一大堆解释
来。那天晚上,我告诉我自己,假如我要制造一部个人电脑,它一定要跟鹿内先生的秘
书一样能干。它必须具有能细致入微地了解我和我身边环境的功能,能够自动引申或压
缩信号,因此大多数场合,我反而成为多余的了。
    关于人机界面,我所能想到的最好的比喻就是老练的英国管家。这位“代理人”能
接电话,识别来话人,在适当的时候才来打扰你,甚至能替你编造善意的谎言。这位代
理人在掌握时间上是一把好手,善于把时机拿捏得恰到好处,而且懂得尊重你的癖好。
认识这位管家的人比一位全然的生客多占了许多便宜。这真是不错。爱因斯坦都帮不上

    能够享受到这种人性化代理人服务的人寥寥无几。我们平日更常见到的一种类似角
色是办公室的秘书。假如秘书很了解你和你的工作,他就能非常有效地充当你的代表。
假如有一大秘书生病了,临时工介绍所即使把爱因斯坦派来,也会于事无补。因为重要
的不在于智商,而在于彼此之间有没有共识,以及当秘书运用这种共识时,能不能为你
的最佳利益着想。
    一直到最近,使电脑具备这样的功能仍是遥不可及的梦想,因此许多人并没有把这
个概念当成一回事。但是,情势瞬息万变。现在,有不少人认为这样的“界面代理人”
是可行的构想。因此,过去问者寥寥的“智能型代理人”构想现在摇身一变,成为电脑
界面设计领域最时髦的研究课题。很显然,人们希望委托电脑来执行更多的功能,不想
事事都亲自操作。
    我们的构想是设计一个知识丰富的界面代理,它不仅了解事物(某件事情的流程、
某个感兴趣的领域、某种做事的方式),而且了解你和事物的关系(你的品味、倾向,
以及你有哪些熟人)。也就是说,这部电脑应该有双重特长,就像厨师、园丁和司机会
运用他们的技能来迎合你在食物、园艺和驾驶方面的品昧和需求一样。当你把这些工作
交由别人执行时,并不表明你不喜欢烹饪、园艺或开车,而是表明你可以选择在你想做
的时候做这些事情,并且,这是因为你想做,而不是不得不做。
    我们和电脑之间的关系亦是如此。我实在没有兴趣在上网之后先进入一个系统,再
通过一堆通信协议,才能找到你的互联网络地址(address)。我只想把讯息传递给你。
同样地,我不希望只为了确认没有错过什么重要信息,就被迫阅读几千个电子公告牌。
我希望让我的界面代理为我代劳。
    会有许多数字化管家,他们有些住在网上,有些就在你身边,还存在于组织的中央
系统和外围设备中(无论组织是大是小)。
    我跟别人讲过,我有二台心爱的智能型寻呼机。它能用完美无缺的英语句子适时地
给我传递重要的信息,简直聪明极了。我的办法是,只让一个人拥有寻呼机的号码,所
有的信息都通过他来传递,只有他才知道我在哪里、哪些事情比较重要,以及我认识哪
些人(和他们的代理人)。智慧来自系统的数据转发器(headend)而不是外围,也不在
寻呼机身上。
    但是,接收端也应该具有智慧。最近,一个大公司的首席执行官和他的助理来访。
这位助理带着老板的寻呼机,他会在最适当的时机,提醒老板一些急事。这位助理这种
老练的、懂得把握时机和慎谋善断的本事,将来都会设计到寻呼机的功能中。《我的日
报》
    想象一下,假若电子报纸能以比特的形式传送到你的家中,假设这些比特都传送到
一个神奇的、像纸一样薄的、有弹性的、防水的、无线的、轻巧明亮的显示器上,要想
为这份报纸设

返回目录 上一页 下一页 回到顶部 0 0

你可能喜欢的