概览
Content Localization on AWS 通过创建由人工智能(AI)提供支持的多语言字幕,帮助扩大视频点播内容的覆盖范围。为视频制作准确的多语言字幕是一项既复杂又费力的工作,需要花费大量时间来进行转录、添加字幕、翻译和审查媒体资产。借助此 AWS 解决方案,您可以自动化这些手动流程,同时仍能控制结果。它包括一个简单的用户界面,您可以在其中使用原生 AWS AI 服务上传、分析和提取视频文件中有价值的元数据。
优势
上传并分析视频,然后使用简单的基于 Web 的用户界面自动生成视频字幕。
您可以在应用程序内审核字幕并进行更正。在您对字幕的结果满意后,可以使用更正后的输入重新运行工作流,从而重新生成下游结果。
使用您对字幕所做的更正生成自定义词汇表和术语。在上传视频以及配置自动化的工作流时提供这些自定义。
技术详情
您可以使用实施指南和随附的 AWS CloudFormation 模板自动部署该架构。
第 1 步
AWS CloudFormation 模板部署了 Media Insights on AWS 解决方案的实例。
第 2 步
一个用于服务此解决方案的 Web 应用程序的 Amazon CloudFront 分配。
第 3 步
用于托管静态 Web 应用程序的 Amazon Simple Storage Service(Amazon S3)Web 源存储桶。
第 4 步
一个用于提供用户目录的 Amazon Cognito 用户池。
第 5 步
用于提供 AWS Identity and Access Management(IAM)联合身份验证以便进行 Web 应用程序身份验证和授权的 Cognito 身份池。
第 6 步
用于 Media Insights on AWS 工作流 API、Media Insights on AWS 数据面板 API 和 Amazon OpenSearch Service API 端点的 Amazon API Gateway 端点。
第 7 步
由 Media Insights on AWS 创建的 AWS Step Functions 工作流。内容本地化工作流由在 Amazon Transcribe、Amazon Translate、AWS Elemental MediaConvert 和 Amazon Polly 中运行任务的 AWS Lambda 函数组成。
这些 Lambda 函数还会与 Media Insights on AWS 数据面板 API 交互,以存储和检索媒体分析任务返回的媒体对象和元数据。此工作流还可以运行 Amazon Rekognition 和 Amazon Comprehend 以对输入进行额外的分析。
第 8 步
一个用于从 Media Insights on AWS 数据管道提取、转换媒体元数据并将其加载到 OpenSearch Service 集群的 Lambda 函数。 每次 Media Insights on AWS 数据面板中的资产元数据发生修改时,Media Insights on AWS 数据面板 Amazon DynamoDB 流都会调用此 Lambda 函数。
第 9 步
一个用于编制媒体元数据索引的 OpenSearch Service 集群。
相关内容
Media Insights on AWS 框架可让开发人员更轻松地构建能够利用 AWS 上的 AI 和多媒体服务来处理视频、图像、音频和文本的无服务器应用程序。此解决方案是一个开发框架,用于向媒体工作流应用机器学习服务。