科普园地 新闻中心

高质量的机器翻译近在咫尺?

冯杰

2018年05月11日 12:00

李恒威 王昊晟
《社会科学报》总第1605期5版


不久前,美国当代著名认知科学家侯道仁教授应邀到访浙江大学哲学系和语言与认知研究中心,并在“西溪哲学对话”论坛上发表演讲。他以王维著名诗篇《鹿柴》和杨绛《我们仨》的片段为例,通过比较谷歌翻译与他自己翻译的差别,表达对机器翻译以及一般人类翻译的看法。
机器翻译简史
1947年,信息论的先驱沃伦·韦弗(Warren Weaver)在写给控制论的奠基者之一诺伯特·维纳(Norbert Wiener)的信中提出了利用计算机进行语言自动翻译的设想,“当我阅读用俄罗斯语写的文章时,我会对自己说,‘这篇文章实际上是用英语写的,只不过被编码成了一些奇怪的符号。现在,我要把这些符号解码回来。’”
1949年,沃伦·韦弗发表《翻译备忘录》一文,正式提出机器翻译(Machine Translation)的概念,即利用计算机将一种自然语言转变为另一种自然语言的过程。1954年,基于沃伦·韦弗“翻译即解码”的机器翻译思想,美国乔治敦大学进行了著名的“乔治敦实验”——利用IBM-701型计算机首次完成了英俄文本的自动翻译。这一实验的成功标志着机器翻译正式登上历史舞台。
随后的数十年间,机器翻译几经浮沉。从50年代的热潮到60年代的低谷,再到70年代的逐渐复苏,机器翻译与人工智能几乎经历着相同的轨迹。进入21世纪后,随着硬件能力的提升和算法的优化,机器翻译终于迎来了全新的繁荣。2016年,谷歌发布新一代GNMT(Google Neural Machines Translation)系统。根据谷歌官方的数据,与早期的PBMT(Phrase-based Machine Translation)系统相比,该系统在英语、法语、西班牙语、中文等主要语言的互译上,将误差率降低了60%以上,并且在规范性文本的语言转换上已经可以达到人类翻译水平。
随着机器翻译的发展不断突飞猛进、凯歌高奏,众多研究者和拥趸开始寄希望于它能够彻底打破桎梏人类语言交流的“巴别塔”,开启全球无障碍沟通的时代。但事实是否如此乐观?美国当代著名认知科学家侯道仁教授对此显然有不同的观点。
深山之空与机器之空
先让我们把时间倒回至一千年以前,远在机器翻译,甚至是近代意义上的“机器”出现之前。天宝三载(744年),王维旅居辋川,期间与友人游览辋川山水,逐处作诗,编为《辋川集》。《鹿柴》正是其中流传广泛的一首:空山不见人,但闻人语响。返景入深林,复照青苔上。
诗歌翻译向来是一件令人头疼的事情,译者需要考虑的不仅仅是诗人写下的文本,最让译者大费周章的是必须悉心揣摩字里行间所蕴含的节律、押韵、情感、意味,甚至是双关、谐音等文字游戏,最后要达到“信、达、雅”的上乘译效,非苦心孤诣不可得。机器翻译能否胜任这项连人类译者都难以完美驾驭的工作?侯道仁教授以谷歌翻译为例展示了谷歌翻译的结果(以下机器翻译均基于谷歌翻译2018年3月版本):Empty mountains are not seen,but people speak loudly.Returning to the deep forest,On the moss.
依照“信、达、雅”的翻译标准,谷歌的这段翻译不仅毫无“雅”之神韵,甚至连基本的“信”也相去甚远。首联的“空山不见人”被误译为了“空山不得见”,尾联的“复照青苔上”则直接漏译了“复照”。短短的四句诗,两句谬以千里,另外两句则味同嚼蜡。毫无疑问,谷歌的这份翻译答卷难称及格。
作为对比,侯道仁教授给出了他自己花费大量时间精心打磨的译文(事实上之前已有几十位译者发表了对该诗的深思熟虑的英译):Bleak peak, no one seen,But hear snips of talk.Late light spins through bosk,Shines back on green bark.
在逐句对应《鹿柴》含义的同时,译文还在形式上尝试进行最大程度的还原:与中文相同,译文每句包含五个单词;每句译文都包含“k”的押韵;以“snips”和“spins”巧妙地在字形上对应颔联与颈联的“人”和“入”。
基于两篇译文的对比,侯道仁教授认为,与《鹿柴》之空山一样,机器翻译也很“空”,但两者之“空”的品质实在有霄壤之别:“深山之空”在于人山一体、心物一体的欲辨已忘言的空寂之空,而“机器之空”则完全是一种心物疏离、毫无意会的空乏之空。
“行走”的南书房
正如前文所说,诗词翻译即使是对于顶尖的人类译者而言都是极大的挑战,以这种严苛的标准要求机器似乎对于这一“非人类”的技术太过不公平。于是,侯道仁教授又选取了来自《我们仨》中的一段文字来进一步测试机器翻译。
《我们仨》是杨绛先生晚年撰写的回忆录,该书以平实且温馨的笔法回忆了与丈夫、女儿几十载生活的点点滴滴。书中的文字远比《鹿柴》更加“平易近人”,并且用语也更加符合当下的规范。比如,原文中写道:客去后,钟书惶恐地对我说:他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。谷歌翻译为: Guest to go, the book of fear in the book said to me:He thought I had to do “South study walking.” This is not a good thing to do, not for meritorious service, but for nothing.
谷歌对“南书房行走”的翻译让人完全不知所云。“South study walking”虽然逐字翻译了这个词汇,但显然读者无法从中明白“南书房行走”究竟所谓何意。事实上,如果了解了这个词的真实含义,就会发现谷歌的翻译与原文可谓“风马牛不相及”。“行走”这个词实际上大体意指“助理”,基于此,侯道仁教授将这个词组翻译为了“South study special aide”。当然,但他也表示,这只是一种尝试性的翻译,因为“special aide”同样没有准确表达出“行走”的含义,“入值”、“执勤”的意象并不能在“special aide”中得以体现。
虽然谷歌翻译在《我们仨》上的表现优于《鹿柴》,但在许多关键甚至核心词句的翻译上,它仍是不合格的。同样,整体的译文也失去了原文中平淡却隽永的意味。
“深度”机器翻译的“浅薄”
从《鹿柴》和《我们仨》的翻译测试中不难看出,机器翻译仍存在着较为明显的不足与缺陷。侯道仁教授认为,当前的机器翻译实际上是深度学习(Deep learning)与大数据(Big data)结合的产物。毋庸置疑,这种技术具有极强的实用性,同时对跨语言交流而言也是绝佳的辅助工具。但他强调,当我们面对“深度学习”和“深度神经网络”时,总会下意识地将“深度”误解为“深刻”,甚至进而将其等同于“强大”或是“聪明”。这种“伊莉莎效应”使我们错误地夸大了机器翻译的能力,以至于认为这种技术能够媲美甚至超越人类译者。事实上,所谓“深度”是指新的神经网络相较于旧的神经网络在输入与输出之间有更多的层次(layer),与思想上的“深度”毫无瓜葛。
相较于对机器翻译“深度”的误解,更值得我们注意的是机器翻译先天存在一种根本性的“浅薄”:无论是谷歌翻译、百度翻译还是其他翻译引擎,它们都缺乏对世界的理解(understanding)。“计算机只是使用词汇,它并不理解词汇……它只是在机械处理文字。它所处理的符号与我们对这个世界的体验无关。它没有记忆可供提取,它能够快速处理文字,但这些文字对它而言没有图像、没有理解、没有意义。”此外,侯道仁教授还特别指出,机器翻译并不会由于“更深度学习”或“更大数据”而改善这种“浅薄”,因为理解力涉及到心(mind)和思想(thought),而当下的机器(尤其本质上以图灵机为根基的机器)是不可能有心和思想的,因此它永远不可能基于理解来翻译,而离开理解的机械操作根本无法实现需要心领神会的翻译!
那么,人类的思想从何而来?侯道仁教授在其2013年与伊曼纽尔·桑德(Emmanuel Sander)合著的《表面与本质:作为思维的燃料和火焰的类比》(Surfaces and Essences: Analogy as the Fuel and Fire of Thinking)中试图作出一定的回答。他提出,类比是人类认知的核心。没有类比就没有概念,没有概念就没有思想。人们通过类比学习概念,并依靠概念进行思考与交流。在侯道仁教授看来,类比并不是表象上的简单对应,而是深入事物的核心,在本质层面上达成统一。将这种类比的观点应用于翻译领域,高质量的翻译是一种“跨文化的类比”,而非“跨文字的对应”,译者只有“背离表面文本之貌,才能契合本质内容之神”。当下的机器翻译并没有掌握类比这一关键技能,仍停留在单词或词组的简单对应阶段。因此,全自动高质量(fully-automatic high-quality)的机器翻译无疑仍是天方夜谭。
当然,对于侯道仁教授而言,机器翻译现实的瓶颈并不意味着这项技术已臻极限。他认为,机器原则上可以真正学会在不同语言之间进行翻译,并且他本人对此也乐见其成,甚至愿意为之脱帽致敬。但是,“所有这一切只有在机器拥有了类似人类的思想、情绪和体验的基础上才能实现,而这绝非近在咫尺的事情。”

(作者:浙江大学 李恒威/教授 王昊晟/博士)

]]>

2018年05月11日 10:28
83
语言是人类最重要的指标