Amazon Transcribe 功能

为什么选择 Amazon Transcribe?

Amazon Transcribe 是一项自动语音识别服务,使您能够轻松地为任何应用程序添加语音转文本功能。 Transcribe 的功能使您能够采集音频输入、生成易于阅读和审查的转录、通过自定义提高准确性,以及筛选内容进而确保客户隐私。

音频输入

Transcribe 旨在处理实时和录制的音频或视频输入,为搜索和分析提供高质量的转录。我们还提供单独的 API,能以独特方式理解客户通话(Amazon Transcribe 通话分析功能)和医疗对话(Amazon Transcribe Medical)。

音频输入

易于阅读的转录文本

Amazon Transcribe 使您可以生成准确的笔录,以便阅读、查看并集成到您的特定应用程序中。我们努力使输出为下游活动(例如通话记录分析、字幕制作和内容搜索)做好准备。

易于阅读的转录文本

自定义输出

准确性至关重要,我们为您提供了许多选项,可以根据您的特定业务需求和方言自定义转录文本。Transcribe 还为每句话提供多达 10 个备选转录文本,因此您可以快速选择适用于您的内容和领域的最佳选项。这对于人工循环字幕制作工作流程很有用。

自定义输出

用户安全和隐私功能

确保客户隐私和安全至关重要。需要时,Transcribe 使您可以掩蔽或移除转录结果中敏感或不适合您的受众的词语。

用户安全和隐私功能

利用生成式通话摘要提高联系中心的工作效率

自动创建生成式人工智能驱动的通话摘要,以帮助座席专注于提供卓越的客户体验,并通过免去通话后的工作来提高工作效率。经理可以快速审查这些摘要,而无需审查整个转录以了解互动背景和调查任何客户问题。

Amazon Transcribe 呼叫分析

音频输入

您可以处理现有的录音或流式传输音频以进行实时转录。使用安全连接,您可以将实时音频流发送到服务,并且可以接收到文本流作为响应。

选择适合电话或多媒体视频内容的模型。例如,Transcribe 可适应联络中心常见的低保真度电话音频。

使用 Amazon Transcribe,您可以自动识别音频文件或流媒体中使用的语言,而无需指定语言代码。Amazon Transcribe 将识别所说的主要语言,或者如果音频中包含多种语言,则它可以识别所说的所有语言并相应地转录语音。当您的客户可能在语言之间切换,或者您的媒体库包含不同语言的音频文件时,这很有用。您还可以使用此功能对媒体内容进行分类,并验证视频和播客中的主要口头语是否已正确标记。

易于阅读的转录文本

Amazon Transcribe 可自动添加标点和数字格式,这样输出几乎可与手动转录的品质相媲美,而且只需很少的时间和费用。数字也被转录成数字或“标准形式”,而不是单词。

Amazon Transcribe 会为每个词返回时间戳,以便您可以在原始录音中轻松找到词或词组,或者为视频添加字幕。

可自动识别讲话者变更并反映在文本中,以准确捕获电话通话、会议和电视节目等场景。了解有关讲话者识别的更多信息。

联络中心可将单个音频文件提交到 Amazon Transcribe,然后该服务将自动识别并制作由声道标签注明的单个脚本。

自定义

通过自定义词汇表,您可以将新词添加到基本词汇表中,以便为域特定的词和词组生成更准确的转录,例如产品名称、技术术语或个人姓名等。

需要时,您可以向 Amazon Transcribe 提交文本数据语料库,为您的应用场景和领域构建和训练自己的自定义语言模型(CLM)。CLM 功能适用于使用您自己的数据提高语音识别准确性。

隐私与安全性

您可以使用词汇表筛选指定要从转录中删除的词列表。例如,您可以指定污秽或污蔑性词列表,Amazon Transcribe 会自动将其从转录中删除。

使用 Amazon S3 密钥(SSE-S3)保护静态数据或指定您自己的 AWS Key Management Service 密钥。Amazon Transcribe 使用 TLS(传输层安全性)1.2,这是一种加密协议,支持经过身份验证的连接和经由 HTTP 通过互联网进行安全数据传输,并使用 AWS 证书对传输中数据进行加密。这包括流式转录。 

收到指示后,Amazon Transcribe 可以帮助客户从支持的语言转录中识别并修订敏感的个人身份信息(PII)。这样一来,联络中心便可以轻松查看和分享客户体验见解和座席培训的转录文本。

Amazon Transcribe 毒舌监察功能通过机器学习保证音频对话文明且有建设性,以鼓励营造一个安全和包容的在线环境。毒舌音频内容被标记为几个类别之一,以便人工审核员轻松识别并采取适当措施。 

Transcribe 呼叫分析

生成呼叫摘要,以自动捕获客户对话中的关键部分(例如问题、结果或行动项),从而帮助座席专注于提供卓越的客户体验和提高呼叫后的工作效率。经理可以快速审查这些摘要,而无需审查整个转录以了解互动背景和调查任何客户问题。

利用机器学习的力量,您可以快速应用语音转文本和自然语言处理功能来揭示有价值的对话见解。随后,您可以将见解整合到入站和出站呼叫分析应用程序中,这些见解包括客户和座席情绪、检测到的问题以及语音特征(例如非通话时间、中断次数和说话速度)等等。这样可以帮助您的主管更方便地确定潜在的客户问题、座席辅导机会和呼叫趋势。

大规模监控您的呼叫,以跟踪是否符合公司政策或法规要求。根据您的指定标准(例如单词/短语或对话特征),构建和训练您自己的自定义分类。例如,您可以设置类别标签,以了解与追加销售或账户取消相关的呼叫各占多少百分比。

允许您的座席访问过去互动中的对话详情。逐条转录可提供诸如客户情绪、检测到的问题和中断等见解。

Transcribe Medical

准确转录医疗口述应用场景中常见的单扬声器音频。 了解详情

准确转录由临床医生和/或患者组成的多扬声器对话音频。 了解详情

跨不同医学专业将语音转录为文本。 了解详情

以高并发性大规模转录录制的医疗音频文件。 了解详情

使用自定义词汇表来表示可能在辞典外的术语,从而提高转录准确性。 了解详情

在任何单声道音频中将来自不同说话人的语音分开。 了解详情