写点什么

跨越 AI 大门,一本翻译蓝皮书、一场人机共译比赛投射出怎样的未来?

作者:脑极体
  • 2023-04-04
    天津
  • 本文字数:4559 字

    阅读完需:约 15 分钟

大语言模型 LLM 是这几个月热度最高的全球明星。目前看来,AI 逐渐走向复杂专业的白领型岗位,已经是必然的趋势。

OpenAI 刚刚发布的 35 页论文中,提到了最容易受到 LLM 影响的职业中译员和笔译员排名第二。

以前机器翻译就是出国旅游时拍拍路标、看看菜谱,现在 GPT-4 连学术论文里的复杂长难句、专业术语都能理解,“人肉翻译”越来越没优势。

生成式 AI 能直接模拟已故的翻译家,输出大师风格的译文,一般人做翻译还有什么前途?

调用 ChatGPT 翻译一本中等部头的英文书,只需要花大概十个小时、四美元,人工翻译卷到天际也达不到这样的性价比……

这段时间,外语专业学生和翻译从业者们有类似心情的人不在少数。

根据中国翻译协会的调查,中国的翻译人才的规模是 538 万人,其中本科以上的中青年为主,这些年轻、专业、高素质的人才如果离开了翻译行业,岂不可惜?

所以,我们应该尽快回答这些问题:AI 时代,我们为什么还需要人工翻译?翻译人才要怎么跨入 AI 的大门?译者+机器的人机协作,有哪些必要条件?

幸好,翻译行业的反应速度远比我们想象得快。4 月 3 日至 4 日,2023 中国翻译协会年会举办,百度翻译联合中国外文局翻译院、中国翻译协会翻译技术委员会,共同发布了《2023 机器翻译技术及产业应用蓝皮书》。

《蓝皮书》系统阐述了机器翻译的发展历程和方向,介绍了产业级机器翻译系统和产品形式,并通过实际案例展示了机器翻译产业应用现状,对机器翻译未来发展提出建议。为推动机器翻译技术与各行业的深度融合提供有益借鉴,为机器翻译技术的产业应用提供有力支持,其客观、全面、权威的信息,也成为翻译人才把握当下趋势的权威参考。



同时,在译协年会上,由百度翻译提供技术和平台支持的“首届全国翻译技术大赛”正式启动,预计赛制持续到 8 月,也为中国翻译人才拥抱技术提供了竞技舞台和窗口期。

没有人会怀疑,我们正处在一个非常重要的历史转折点。面对大语言模型等最新 AI 技术带来的无数可能性,中国翻译人才可以不焦虑、不盲目、有底气的进入人机共译新阶段。


不焦虑:“见识过‘珍妮纺纱机’,我还是选择当翻译”

在翻译行业工作多年的小 A 表示:太阳底下无新事,翻译人见过的“AI 威胁论”并不少。

2016 年,翻译领域就曾出现过类似的“珍妮纺纱机时刻”。当时,一篇名为《翻译界的重大突破!作为一个翻译,此刻我理解了 18 世纪纺织工人看到蒸汽机时的忧虑和恐惧!》的文章,传遍了翻译人的朋友圈。

不少译员和外语系学生就像在手工棉纺织时代,看到了由蒸汽机带动的珍妮纺纱机,能同时纺 8 卷线一样,感到非常担忧。

原来,百度于 2015 年发布了全球首个互联网神经网络机器翻译系统。随后,谷歌、微软相继部署了以神经网络作为基础的机器翻译系统。这种机器翻译技术,通过建立深度神经网络模拟人类的翻译过程,在语言表示、语义理解、译文生成等方面有显著进步,让机器翻译的质量大幅提升。结果呢?今天人类翻译依然存在,而大众使用翻译服务的门槛则大大降低了。

更早一点,上世纪末的翻译人,也曾遇到过“珍妮纺纱机”。九十年代,统计机器翻译方法的出现,可以基于大规模语料自动训练模型参数,这种方式不需要人工专家来构建翻译规则,比基于规则的机器翻译效率更高、效果更好,弥补了当时国内高水平的专业翻译人才匮乏、不能满足实际需求的问题,让更多高质量的译著走出了国门,走进大众视野。

作为一种更古早的机器翻译技术,基于规则的机器翻译,其实也曾是人类眼中的“珍妮纺纱机”。上世纪五十年代,哪怕穷尽全球翻译家们一生的力量,也只能掌握几十种语言,译著只占人类作品总量的冰山一角,通过计算机自动完成翻译,解决全球沟通和交流的问题,也带来了翻译业态的快速发展。

把时间拉回到当下,以 ChatGPT、文心一言为代表的新一代预训练模型技术,通过超大规模的数据和充分训练实现了智能涌现效应,大幅提升了机器翻译的鲁棒性和容错能力。


所以说,机器翻译从来没有真正消灭人工翻译,这是历史上被多次证明的,反而机器翻译让高质量翻译人才的需求更加旺盛。

面对新的机器翻译技术,翻译人才对于“珍妮纺纱机”的恐惧,更多是源于对于自身发展的不确定。幸好,这种“不确定”正在被“国家队”所改变。

在刚刚发布的《2023 机器翻译技术及产业应用蓝皮书》中,中国翻译协会的调研数据显示,有超过 85% 的受访者认为“机器翻译 + 译后编辑”的工作模式会在更大范围内应用。


《蓝皮书》认为,机器翻译成为人类译员的得力助手和有效补充,促使翻译行业催生出更多如译后编辑、机翻质量控制等新职业,正在多种场景中被应用。

简单举几例:

1.加速短视频、网络文学等中国优质内容出海。人人译视界助力 B 站的海外达人项目,完成三百多个频道的译制工作;晋江文学城、米读小说 APP 使用针对网络文学垂直领域定制优化的机器翻译系统,将大量本土网络文学作品翻译成英语、西班牙语、葡萄牙语等语种,获得海外用户的青睐。

2.助力企业海外市场经营。中石化的企业智能翻译平台,支撑境外财务票据核销、重大项目审计、合规备案等翻译工作;新华社的“新华丝路”, 引入智能翻译平台,辅助人工译员提高翻译效率。

3.支撑各行各业数字化建设。译马网引入“AI+人工” 的译后编辑模式,日均翻译字数可提升近 4 倍,翻译成本降低 34%;迈迪培尔开发的医药等垂直领域机器翻译,为科研人员的研究工作提供了极大便利。

总之,翻译领域的新机会还有很多,更详细的信息,大家可以在《蓝皮书》中阅览。

机器翻译大有用武之地,高端翻译人才也是时代所需。二者相辅相成,可以满足不同层次的翻译需求,在获取全球信息、对外交流等方面将发挥越来越重要的作用。

作为普通人,要做的是学习驾驭最新的“珍妮纺纱机”,把机器翻译用好,不是留恋做一个“手工纺纱人”。

不盲目:从朦胧到清晰的人机协作之路

那么,“AI+人工” 的译后编辑工作模式下,究竟怎样才算用好 AI 技术?人机共译,需要具备哪些技能?

《蓝皮书》提供了方法论,呼吁培养 “翻译 + 技术 +N”的精翻译、懂技术、能力强的新时代高端翻译人才。首届全国翻译技术大赛,则提供了具体的实现路径。

要将 AI 技术和机器翻译作为得力助手,人类译员想要提高技能,也不能盲目。

“首届全国翻译技术大赛”,由中国外文局、全国翻译专业学位研究生教育指导委员会指导,中国翻译协会、中国外文局翻译院、大连外国语大学主办。百度翻译作为承办单位之一,提供翻译技术与比赛平台支持。


从阵容中不难看到,赛事为推动行业各方对机器翻译技术的了解和应用,提供了清晰的方向和路径:

1.清晰的培养方向。

举办方是百度翻译,和翻译行业的“国家队”,保证了比赛涉及内容的前沿性和权威性,同时,赛事向各类翻译爱好者开放,高校学生、翻译机构、企业单位等都可以参与,人才覆盖面广。

由此证明,复合型翻译人才的培养,AI+翻译融合学科的建设,离不开政产学研用多方形成合力,提供更充沛的实践机会和更明确的方向引导。

2.清晰的技能标准。

中国的翻译人才要开启“人机共译”工作新范式,需要具备哪些核心能力?比赛考核点的设计,也给出了清晰的答案,让人才能够不再迷茫,提早培养自身的竞争力。

比如以往的翻译比赛,主要考察人类译文的准确性、优美性,而此次比赛,还将对机器翻译的掌握,纳入了考核,包括对机器翻译软件内置功能是否熟悉,操作熟练度如何,是否充分运用了技术,做到真正以赛促学,帮助大家掌握先进的机器翻译工具。


(译后编辑能力考察:术语替换题)

3.清晰的产业基石。

大赛由百度翻译提供技术和平台支持,背后也有着深度的考量:中国翻译综合能力的提高,要建立在怎样的机器翻译底座上?

选择百度翻译,一是技术领先,百度于 2015 年自主研发的全球首个互联网神经网络翻译系统,能够快速提高翻译产能,是较为先进的机器翻译工具。

二是平台能力,百度智能文档翻译平台的创新人机共译模式,将机器翻译(Machine Translation)+ 译后编辑(post-editing)+ 模型自学习相结合,让机器翻译结果越用越准,效率不断提升。

三是应用丰富。百度智能文档翻译平台,提供术语参考、翻译记忆、智能纠错等功能,内置权威术语,查证更省力,在工作中真正为人类译员减负。

从底层技术到上层应用的优势,是百度智能文档翻译平台“被选择”的原因,也为翻译行业和翻译人才接下来的发展提供牢靠的支持。

翻译人才如何跨入 AI 的大门,从首届全国翻译技术大赛开始,路径正从朦胧走向清晰。


(产业级机器翻译系统流程图)

有底气:从一群人的比赛,到全民的新可能

你可能会问:我又不当译员,机器翻译的发展跟我又有什么关系呢?

当然有。

从基于规则的机器翻译,到大语言模型驱动的机器翻译,机器翻译技术的每一次更迭,都会让全社会、全世界广泛受益。

你读到的一部译本,与海外朋友的一次对话,境外旅游时的无碍沟通,前沿论文的快速传播……翻译成本不断降低,以前需要请一个翻译,现在手机 app/翻译笔就能搞定;体验越来越丝滑,原本要分段复制粘贴的学术论文,现在整个丢进百度智能文档翻译,就能直出全部译文,还带还原版式,阅读效率也高多了。

对于个人来说,跨语言沟通、学习和交流,是成长和进步的基础,通过百度翻译这样的智能产品获得更高质量、更低成本的翻译服务,减少了很多不必要的时间和操作,某种程度上来说,是一种人生的提速。


对于企业来说,产品出海或跨境贸易,需要在翻译上投入高成本,有时还不能快速到位,一些翻译相关业务场景需要定制化开发,缺乏相应的人才。

《蓝皮书》中提到国内某世界 500 强企业,需要通过海外媒体报道和电商渠道的消费者评论等信息,进行海外市场经营决策,涵盖近百种语言,每月翻译需求超百亿词,涵盖文本、文档、图片等多种形态,海量而冗杂的翻译任务,全靠人工根本没办法及时跟进最新市场动向。

中国企业要“走出去”,AI+机器翻译,是必不可少的辅助。

百度翻译从模型到应用的丰富能力,背靠百度生态,可与计算机视觉、语音处理等人工智能技术深度融合,全面、及时、深入响应不同行业不同场景的业务需求。


对国家来说,翻译能力是国家软实力的一部分。

中国外文局局长、中国翻译协会会长杜占元指出,国家翻译能力,是通过翻译行为建构对外话语、开展文化传播、塑造国家形象的综合能力,是文化软实力和国际传播能力的重要组成部分,也是发挥大国作用、提升国际话语权的重要保障。

从这个角度看,加强国家翻译能力建设,除了传统手段之外,机器翻译的技术领先性、安全性、可用性愈发重要。


百度在大模型技术、大语言模型(LLM)、自然语言处理(NLP)方面深耕多年的技术储备和领先实力,从芯片、深度学习框架到翻译模型的核心模块自研能力,让百度翻译有望成为首屈一指的产业级机器翻译系统,在翻译行业智能化、数字经济交流中发挥作用。

这些力量融合起来,才推动中国翻译来到新的转折点。而一个沟通无碍、高效的新世界,会让一个人、一个企业、乃至一个国家,都获得新的机会与可能。

1999 年,万维网的发明者、互联网之父 Tim Berners-Lee,就曾提出过一个概念:social machine(社会机器),即人与机器的协作体。人负责创造,而机器负责执行。当时,最热的机器是家用电脑,全国都兴起一股“电脑热”,各种电脑培训班、电脑操作书籍纷纷问世,和今天的“AI 热”差不多。

如果你不会恐惧电脑、抗拒电脑,那当然也不应该恐惧 AI。AI 时代,我们仍然需要人类译者,语言的通天塔一天没有越过,翻译的火种便会生生不息。

个人对机器翻译的不同态度和选择,将迎来不同的命运,但愿你的选择,映射的是你的希望,而非恐惧。

发布于: 刚刚阅读数: 2
用户头像

脑极体

关注

还未添加个人签名 2020-06-12 加入

还未添加个人简介

评论

发布
暂无评论
跨越AI大门,一本翻译蓝皮书、一场人机共译比赛投射出怎样的未来?_百度_脑极体_InfoQ写作社区