什么是机器翻译?

机器翻译是在无人工参与的情况下,使用人工智能自动将文本从一种语言翻译成另一种语言的流程。现代机器翻译超越了简单的词对词翻译,能以目标语言传达原始语言文本的全部含义。它可以分析所有文本元素并识别单词如何相互影响。

机器翻译有哪些优势?

借助机器翻译服务。人工翻译人员可以更快、更高效地进行翻译。我们在下面列举了机器翻译的一些优势:

自动翻译辅助

机器翻译为专业的人工翻译提供了一个很好的起点。许多翻译管理系统会将一个或多个机器翻译模型集成到其工作流程中。它们具有自动运行翻译的设置,然后将其发送给人工翻译进行后期编辑。

速度和工作量

机器翻译的速度非常快,几乎可以瞬间翻译数百万个单词。它可以翻译大量数据,例如实时聊天或大规模法律案件。它还可以处理外语文档、搜索相关术语,并记住这些术语以供将来应用。

大量语言选择

许多主要的机器翻译提供程序可支持 50-100 多种语言,还同时针对多种语言提供翻译服务,这对于全球产品推广和文档更新很有用。

经济高效的翻译

机器翻译提高了生产力和更快交付翻译的能力,从而缩短了上市时间。由于机器翻译可提供基本但有价值的翻译,因此可减少过程中的人工参与,从而降低交付成本和时间。例如,在大批量项目中,您可以将机器翻译与内容管理系统集成,以便在将内容翻译成不同语言之前自动标记和组织内容。

 

机器翻译有哪些使用场景?

下面列举了机器翻译的几个使用场景:

内部沟通

对于在全球不同国家/地区运营的公司而言,沟通方面可能较为棘手。每位员工的语言技能各不相同,而且有些人对公司的官方语言不是很懂。机器翻译有助于降低或消除沟通中的语言障碍。个人可以快速获得文本的翻译并理解内容的核心信息。您可以使用它来翻译演示文稿、公司公告和其他常见的沟通信息。

外部沟通

公司使用机器翻译来更有效地与外部利益相关者及客户沟通。例如,您可以为全球合作伙伴和客户将重要文件翻译成不同的语言。如果一家线上商店在许多不同的国家/地区运营,机器翻译可以翻译产品评论,以便客户阅读以自己的语言显示的内容。

数据分析

某些类型的机器翻译可以处理数百万用户生成的评论,并在短时间内提供高度准确的结果。公司每天翻译社交媒体和网站上发布的大量内容用于分析。例如,他们可以自动分析用各种语言编写的客户意见。

在线客户服务

通过机器翻译,品牌可以与世界各地的客户互动,无论他们使用何种语言。例如,他们可以使用机器翻译来:

  • 准确翻译世界各地客户的请求
  • 扩大实时聊天的规模并自动翻译客户服务电子邮件
  • 在不雇用更多员工的情况下改善客户体验

法律研究

法律部门使用机器翻译来准备不同国家/地区的法律文件。通过机器翻译,大量原本难以处理的不同语言的内容可用于分析。

机器翻译的发展史

使用计算机自动翻译人类语言的想法最早出现在 1950 年代初期。然而,在当时,翻译的复杂性远远超出了计算机科学家的初步估计。它需要巨大的数据处理能力和存储能力,这超出了早期机器的能力。

在 2000 年代初期,计算机软件、数据和硬件能够进行基本的机器翻译。早期的开发人员使用语言统计数据库来训练计算机翻译文本。这需要投入大量的人力和时间。添加每种语言都需要从头开始该语言的开发工作。此后,机器翻译在速度和准确性方面得到了发展,并出现了几种不同的机器翻译策略。

机器翻译有哪些不同的方法?

在机器翻译中,原始文本或语言称为源语言,而您要将其翻译成的语言称为目标语言。机器翻译遵循基本的两步流程:

  1. 解码原文的源语言含义
  2. 将含义编码为目标语言

我们列举了一些关于语言翻译技术如何实施这一机器翻译流程的常用方法。

基于规则的机器翻译

语言专家为特定行业或主题开发内置语言规则和双语词典。基于规则的机器翻译使用这些词典准确翻译特定内容。该流程的步骤是:

  1. 机器翻译软件解析输入文本并创建过渡表示
  2. 它使用语法规则和词典作为参考,将表示转换为目标语言

优点和缺点

基于规则的机器翻译可以针对特定行业或主题进行定制。它是可预测的,并能提供高质量的翻译。但是,如果源文本有错误或使用了内置词典中不存在的单词,生成的结果会不太理想。改进它的唯一方法是定期手动更新字典。

统计机器翻译

统计机器翻译不依赖语言规则,而是使用机器学习来翻译文本。该机器学习算法会分析大量已经存在的人工翻译并寻找统计模式。然后,当被要求翻译新的源文本时,该软件会做出智能猜测。它根据特定单词或短语与目标语言中的另一个单词或短语的统计可能性进行预测。

基于语法的机器翻译

基于语法的机器翻译是统计机器翻译的一个子类别。它使用语法规则来翻译句法单元。它分析句子以将句法规则集成到统计翻译模型中。

优点和缺点

统计方法需要针对每个语言对训练数百万个单词。不过,有了足够的数据,机器翻译会变得更加准确。

神经机器翻译

神经机器翻译使用人工智能来学习语言,并使用称为神经网络的特定机器学习方法不断改进知识。它通常与统计翻译方法结合使用。

神经网络

神经网络是受人脑启发的一组相互连接的节点。它是一个信息系统,其中,输入数据通过几个相互连接的节点生成输出。神经机器翻译软件使用神经网络来处理庞大的数据集。每个节点会对源文本进行一次属性化更改,将其更改为目标文本,直到输出节点给出最终结果。

神经机器翻译与其他翻译方法

神经网络在生成输出句子时的每一步都会考虑整个输入句子,其他机器翻译模型则是将输入句子分解为单词和短语集,然后映射为目标语言中的单词或句子。神经机器翻译系统可以摆脱其他方法的诸多限制,并且通常会达到更好的翻译质量。

混合机器翻译

混合机器翻译工具在一个软件上使用两个或多个机器翻译模型。您可以使用混合方法来提高单个翻译模型的效果。此机器翻译流程通常使用基于规则和统计的机器翻译子系统。最终的翻译输出是所有子系统输出的组合。

优点和缺点

混合机器翻译模型能克服与单一翻译方法相关的问题,从而成功提高翻译质量。

什么是计算机辅助翻译工具?

计算机辅助翻译(CAT)工具与机器翻译软件配合使用以支持文本翻译。CAT 工具可自动执行与翻译相关的任务,例如编辑、管理和存储翻译。文本被输入到 CAT 软件中,并被分割成短语、句子或段落等片段。该软件将每个片段及其翻译保存在数据库中,从而加快翻译流程并保证与以前翻译的一致性。

 

许多全球公司使用 CAT 软件工具来自动处理需要翻译的项目。

自动翻译

自动翻译是指 CAT 工具中内置的任何自动化功能,用于执行重复的翻译相关任务。自动翻译与嵌入在文本中的触发器一起工作,这些触发器将指示系统使用自动化功能。例如,您可以使用它将常用文本插入数据库中的文档中。

最准确的机器翻译技术是什么?

神经机器翻译是公认最准确、最通用和最流畅的机器翻译方法。神经机器翻译于 2010 年代中期问世,目前已成为最先进的机器翻译技术。从流畅性到概括性等各个方面,它都比统计机器翻译更准确。它现在被认为是机器翻译开发的标准。

机器翻译器的性能取决于几个因素,包括:

  • 机器翻译引擎或技术
  • 语言对
  • 可用的训练数据
  • 用于翻译的文本类型。随着软件执行特定语言或领域翻译量的增加,它将生成更高质量的输出。经过训练,神经机器翻译将变得更准确、更快速、更容易添加语言

机器翻译可以代替人工翻译吗?

机器翻译可以在一些情况下取代人工翻译,前提是翻译通顺、翻译量大且有此需求。例如,许多与服务相关的公司使用机器翻译,通过即时聊天功能或快速回复电子邮件来帮助客户。但是,如果您翻译的是更深入的内容,例如网页或移动应用程序,则翻译可能不太准确。在使用这些内容前,让人工翻译人员对其进行编辑非常重要。

Amazon Translate 如何提供帮助?

Amazon Translate 是一项神经网络机器翻译服务,可提供快速、优质、经济实惠且可自定义的语言翻译。您可以对面向不同用户的网站和应用程序的内容进行本地化、轻松翻译大量文本以进行分析,并且高效实现用户间的跨语言交流。借助 Amazon Translate,您可以:

  • 通过简单的 API 调用轻松将其集成到您的应用程序中
  • 使用自定义术语自定义您的机器翻译输出,以定义您的品牌名称、型号名称和其他独特术语的翻译方式
  • 通过快速可靠的翻译扩展以满足您的翻译需求

要开始使用 Amazon Translate,请立即创建一个 AWS 账户

AWS 的后续步骤

查看其他与产品相关的资源
了解有关 Amazon Translate 的更多信息 
查看 AWS Free Tier

立即通过 AWS Free Tier 享受免费服务。

查看 AWS Free Tier 
开始在控制台中构建

在 AWS 管理控制台中开始构建。

注册