追随智慧-第38部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
氖焙虻昃喝鼗窠保呖嫉氖焙蜃猿啤胺乔寤蝗ァ保峁涂忌狭饲寤4颖究频�325博士,还是一帆风顺。他觉得普天之下没有自己做不成的事。可是,就在两天前,他满怀信心地写下这几行参数以后,面前那台电脑却拒绝接受他的“指令”。研究无法继续,他那迄今为止无所不能的历史似乎中断了。
隔壁那个方格子里的陈正,是邸烁昔日的清华同学如今的微软同事。看来这小子的运气不错,没有遇到什么特别棘手的问题。一口浓重的福建口音,不仅没有阻挡他对语音模型的研究,而且还促使他启动了“电脑自动纠错模型”的课题,其方法,是请数十个中学生以拼音方式敲击键盘,将其中错误统计归纳,依照概率大小的顺序排列,然后利用电脑的善于计算的能力,予以纠正。这时候,他已经算出,汉语拼音字母“U”在“O”
之后被遗漏的概率,为1%;“I”和“O”在键盘上并列紧邻,所以混淆的概率很高,为3%。有了这样的结果,他就可以顺利地为他的“模型”写下两行程序:P(itypedaso)0。03时间已是深夜。陈正推推他那厚厚的眼镜,志得意满地走了。邸烁却没有一点要离开的意思。他在等待着P(udeletedaftero)0。01326地球那一边的黎明。太平洋两岸的时差有16个小时,所以他和雷德蒙市微软总部研究人员的联络,通常都是在这一边的午夜而那一边的早晨进行。这两天,他为了自己的难题,已经和地球那边联络了无数次,仍然无计可施。现在,他打算再做最后一次努力。
看看到了雷德蒙的上班时间,他把电子邮件送给美国微软总部的研究员黄美玉。黄美玉已经给他出了不少主意,全都无效,无奈之中随便问道:“也许‘采样参数’有问题?”邸烁做的工作是,在一个英语语音识别系统之上,建立汉语语音识别的功能。黄美玉说的“采样参数”,是指分析语音时所确定的频率,事关“样本”多寡,所以意义重大,但这又是一个太简单的问题,所以两天以来谁也没有注意。
现在,邸烁把注意力再次转向电脑屏幕,那个小小括号里的“11”,意味着他选择的采样频率,是在每秒种的声波中,等间隔采样11000次。这与英语语音的采样频率“16”有很大不同。但事实可能是,当我们把每秒钟的声音切割成上万份让机器识别的时候,汉语和英语327这两种截然不同的语言已经完全没有区别。
这念头电闪雷鸣般在邸烁脑袋里面划过。他飞快地打开自己的程序,写下新参数:MFCVERSION〔1〕RESAMPLE〔16〕电脑瞬时间痛快地运行起来,邸烁长出一口气。一边责怪自己怎么会犯这样一个低级错误,一边又恢复了往日的自信。
邸烁和陈正同为清华大学计算机系1998年毕业的博士,差不多同时进入微软中国研究院,又一同进入李开复小组,开始同一个课题的研究--汉语语音识别系统。
不过,在1999年6月1日这一天,李开复导演的一个小小游戏,把两个人分开了。那时候,邸烁和陈正已经不分彼此地为这个项目倾注了两个月的心血,李开复忽然对这两个人说,语音识别既包含“语音”,也包含“语言”。
两者密切关联但又不是一回事,研究的程序也应先分再合。这道理很明白,所以陈、邸二人没有异议。于是李328开复请两人自由选择,他说两件事情都很重要,相信无论谁做什么都能胜任。两人全都不知如何是好。李开复笑道:“反正总要分开,不如抛硬币来决定。”然后就真的把一枚硬币抛向空中。这种把一个沉重话题化作一场乐事的态度,令两个初出茅庐的学生既惊又喜。3个人在一片笑声中决定,邸烁做“语音”,陈正做“语言”。两者在将来的结合,就将成为微软研究院的“汉语语音识别系统”。
要对“汉语语音识别系统”有个正确了解,我们就要注意到90年代最后两年国内舆论提到的事实:国际商用机器公司1998年在北京推出最新版本“ViaVoice98”。
尽管此项技术在语音识别领域处在领先位置,但却仍未达到成熟的程度,其在一般公众中的宣传价值,也超过了实际应用的价值。如果软件市场真如人们所说是个赌场,那么,国际商用机器公司投出这一“赌注”,与其说是为了商业利益,不如说是为了强占“头筹”。1999年开始的时候,“语音识别”在我们国家的舆论中更加热闹。
《每周电脑报》的文章说:“历经多年研究和挫折之后,过去18个月里面语音识别技术已经达到很高的水平。”329《经济参考报》还宣布,“键盘的终结者”已经出现。
商周在《计算机用户》上说是“百家争‘鸣’”,这有些夸张,但他说的“全面启动”却有充分根据。
计算机专家所谓“语音识别系统”,说白了,就是比尔.盖茨说过的半句话:“让电脑会听,会说。”(另外的半句是“会看,会学习”)不过,还有一个人比比尔.盖茨更早地将语言特性与计算机的功能联系起来。诺姆.乔姆斯基曾经说,人类语言就像一个开关。此人是美国现代语言学领域最有名的一位教授,其基本理论构成了美国语言学的主流。按照他的解释,婴儿的语感是重复的结果。诸如“一头牛”和“一匹马”,其间量词在中国尽人皆知,不用专门教育,更无须复杂的语法规则加以指导,即使3尺孩童,一听也能明白,这里该用“头”,那里该用“匹”。但外国人学来学去总会糊涂。其缘由,概因人的大脑中有着“重复记忆”的能力。这一基本逻辑在计算机科学中的应用,也就是人工智能。它构成了语音识别研究的起点。
就我们所能理解的来看,语言的问题在计算机领域无所不在。乔姆斯基所说的“开关”,与计算机最基本之330“开”与“关”的运行逻辑,在表述上的不谋而合,似乎也就潜在着让计算机来接受人类语言的可能。但是正如我们此前提到的,电脑毕竟不是人脑,所以种种以机械模拟人脑的努力全都毫无结果,惟有李开复以统计学的方法另辟蹊径,终有所成。然而仔细追究起来,其成功的大厦仍然建立在一个最原始的基点上:语感是重复的结果。
“语感”这概念说起来很神秘,实则是可以观察到的。它包含于我们周围无处不在的语言材料中:书籍、文件、报纸、广播、演讲、街谈巷议、电视节目……所有这些,专家们有一个恰当的词汇加以描述,叫做“自然语言”。与此相对的计算机语言,乃是“人工语言”。30年来计算机语音专家所做的全部工作,就是试图在自然语言和人工语言当中建立一个桥梁。
就算不能让机器具有我们人类的七情六欲,至少也该让它既能听懂人话,又能说出人话。但是,平心而论,汉语语音识别的进展,有如汉语的文字输入,一直明显落后于英语。电脑终究是美国人发明的玩意,就算“能听会说”,也是英语优先。幸而电脑并无国籍倾向,也无331民族激情,所以只要中国人在它身上倾注足够的智慧,它也会有足够的耐心来听中国话。只不过,在21世纪将要开始的时候,这一份努力却又由美国人来主持,这情景电脑虽然不在意,但中国人却有点不太好受。
在过去很多年里,微软公司在语音识别的领域并不能说领先。当日李开复在苹果公司向“早安美国”的2000万观众展示他的“小精灵”时,微软连语音识别的研究小组还没有建立起来呢。不过,“小精灵”在苹果“死了”,微软却崛起了一个黄学东小组。黄在语音识别领域取得一系列出色的成果,但这仍属于英文的领域。至于中文语音识别,在我们国家中始终不能振作,直到90年代末期,4大美国公司在北京一起涉足,舆论为之一振,学者趋之若骛。国际商用机器公司声称,他们在这方面的研究已经持续了27年,其技术也的确略胜一筹。余者还有摩托罗拉,已有3年研究中文语音的历史,还有英特尔,也有好几个月了。当李开复在1999年春天启动微软的汉语语音研究时,周围的情势就是这样。他有些着急,但仍旧胸有成竹:微软毕竟多次上演过后发先至的喜剧,这一次期望能够再现。
332打开门,世界前沿原来就在眼前邸烁和陈正1999年春季进入希格玛大厦的时候,对于这些情况并不能完全了解。陈的专业属“人工智能”,邸的专业是分布式计算。两人对于“语音识别”全都是外行。在李开复看来,“人工智能”恰为过去20年计算机领域里的一条失败之途,更与未来语音的进展无关。
他告诉邸、陈二人,他们可以选择自己感兴趣的题目,但不能离开研究院的大框架。邸、陈二人一致表示对李开复的“语音识别”感兴趣。他们从中国的报纸上知道了李开复以往的辉煌,所以希望进入这个领域追随李开复。按照常情,李开复在这个时候既然想要建立语音研究小组,必会想到身边一派竞争情势。他的手下若是没有一批高水准且熟知这一领域的研究员,焉能后来居上?然而他又相信,计算机世界中,人的才智与资历并非总是能够一致,经验常常不是最重要的,甚至有可能成为弘扬智慧的障碍。这道理在他本人已有十几年前卡内基梅隆大学的体会为证。当日两个年轻人的聪慧胜过了15个资深研究者的经验,如今又怎么能说面前这两个年轻人必定不会再现当年的局面?
333接下来的情形,有点像是在学校而不是在研究院或者公司。整个4月份,邸烁和陈正都在阅读李开复的两本书:一本是他的博士论文,另外一本是他后来写的关于语音识别的书。还有李开复指定的另外几十篇论文。
这时候两个人方知什么叫做“世界的眼光”和“世界的前沿”,因为李开复让他们阅读的这些东西,全是过去十几年中世界语音识别研究的经典之作。这情形若是同我们国家大学校园中的研究状况加以比较,不免让人回味。
不少中国学生都有过“直到毕业也没有读过一篇完整的世界水平论文”的经验。就连我们在前面叙述过的“清华园的神奇小子”李劲,也不能例外。所以很多人根本不知道国门之外的人究竟做过什么,以及怎样去做。邸烁和陈正却在刚刚开始的时候,便有机会了解世界上究竟发生了什么。
但事情不仅如此。李开复还觉得有必要开辟一个“两个人的课堂”。“学生”自然就是邸烁和陈正,而“老师”正是他自己。他花了很多时间和两个副研究员谈论书籍和论文的内容,尽可能用简单的方式给他们解释“语音识别”的来龙去脉。邸烁后来回忆道:“他很会讲课,讲334过一次以后,我们再看论文,就很顺利了。”但也有并不顺利的时候,但逢这种时刻,李开复总是笑眯眯地看着这两个人,怂恿他们“猜猜看”,然后笑道:“猜错了嘛!”
“这里的气氛真是好,没有一点压抑的感觉。”陈正说,“一个院长、一个很有名的科学家,没有想到他竟能给我们讲课。他真的是一点架子都没有。所以虽然我们经常会出错误,但却并不紧张。”两个“学生”开口闭口叫着“开复”,心里倒是真的把他当成老师了。当李开复在中国的报纸上成为一个“抢人才”的话题时,看来他在研究院里仍是受到尊敬的老板和导师。研究院的气氛既像学校,又像公司,按照通常的习惯,刚刚走出校�