Amazon Transcribe の機能

Amazon Transcribe が選ばれる理由

Amazon Transcribe は、音声をテキストに変換する機能を任意のアプリケーションに簡単に追加できるようにする自動音声認識サービスです。 Transcribe の機能を使用すると、音声入力の取り込み、読みやすくレビューしやすいトランスクリプトの生成、カスタマイズによる精度の向上、顧客のプライバシーを確保するためのコンテンツのフィルタリングが可能になります。

音声入力

Transcribe は、ライブ音声や録音された音声または動画入力を処理して、検索および分析のために高品質の文字起こしを提供するように設計されています。また、顧客の通話 (Amazon Transcribe Call Analytics) と医療に関する会話 (Amazon Transcribe Medical) を独自の方法で理解する個別の API も提供しています。

音声入力

読みやすいトランスクリプト

Amazon Transcribe を利用すると、閲読、レビュー、特定のアプリケーションへの統合を簡単に行うことができる正確なトランスクリプトを生成できます。私たちは、通話記録の分析、字幕作成、コンテンツ検索などの下流のアクティビティで出力を準備できるように取り組んでいます。

読みやすいトランスクリプト

出力をカスタマイズする

正確性は非常に重要であり、特定のビジネスニーズや言語に合わせてトランスクリプトをカスタマイズするための多くのオプションを提供します。Transcribe では、文ごとに最大 10 個の代替トランスクリプションも提供されるため、コンテンツとドメインに適用される最適なオプションをすぐに選択できます。これは、人間によるインザループ字幕作成ワークフローに役立ちます。

出力をカスタマイズする

ユーザーの安全性とプライバシー機能

顧客のプライバシーと安全を確保することは非常に重要です。必要に応じて、Transcribe を使用すると、機密性の高い単語や視聴者にとって不適切な単語を文字起こし結果からマスクしたり削除したりできます。

ユーザーの安全性とプライバシー機能

生成された通話要約でコンタクトセンターの生産性を向上

生成 AI を活用した通話要約を自動で作成できます。これにより、エージェントは優れたカスタマーエクスペリエンスの提供に集中できるほか、通話後の作業が減って生産性が向上します。マネージャーは、トランスクリプト全体を確認しなくても、これらの要約をすばやく確認して、やり取りの状況を理解し、お客様の問題を調査することができます。

Amazon Transcribe Call Analytics

音声入力

既存の音声録音を処理したり、リアルタイム文字起こしのために音声をストリーミングしたりできます。セキュアな接続を使ってこのサービスにライブオーディオストリームを送信すると、その応答として文字に起こされたテキストのストリーミングを受信できます。

通話やマルチメディア動画コンテンツに合わせて調整されたモデルを選択できます。例えば、Transcribe は、コンタクトセンターでよくある忠実度の低い電話音声に適応します。

Amazon Transcribe を使用すると、言語コードを指定しなくても、オーディオファイルまたはストリーミングメディアで話されている言語を自動的に識別できます。Amazon Transcribe は、主に使用されている言語を識別します。音声に複数の言語が含まれている場合は、話されているすべての言語を識別し、それに応じて音声を文字起こしします。これは、顧客が言語を切り替えている場合や、メディアライブラリにさまざまな言語のオーディオファイルが含まれている場合に役立ちます。この機能をメディアコンテンツの分類のために使用して、動画やポッドキャストで話されている主な言語が正しくラベル付けされていることを確認することもできます。

読みやすいトランスクリプト

Amazon Transcribe では句読点や番号の形式が自動で追加されるので、わずかな時間と費用で、人の手による文字起こしに比べても遜色のない出力が仕上がります。数値は、単語ではなく数字または「標準形式」に転写されることもあります。

Amazon Transcribe では、すべての単語にタイムスタンプが付加されるので、オリジナルの録音音声で単語やフレーズを簡単に検索したり、動画に字幕を付けたりすることもできます。

話者の交代を自動で認識してテキストに反映させ、電話、会議、テレビ番組などの会話のやりとりを高精度に読み取ります。話者の識別の詳細については、こちらをご覧ください。

コールセンターが 1 個の音声ファイルを Amazon Transcribe に送信すると、このサービスはチャネルのラベルが付いた 1 件の文字起こし原稿を自動で識別および生成します。

カスタマイズ

カスタム語彙を使用すると、基本語彙に新しい言葉を加えることができ、製品名、技術用語、個人名といった分野固有の用語やフレーズを、より高精度に文字起こしすることができます。

必要に応じて、テキストデータのコーパスを Amazon Transcribe に送信して、ユースケースやドメインに合わせた独自のカスタム言語モデル (CLM) を構築してトレーニングできます。CLM は、独自のデータを使用して音声認識の精度を高めるのに適した機能です。

プライバシーとセキュリティ

語彙フィルタリングを使用して、文字起こし原稿から削除する単語のリストを指定できます。例えば、卑猥な単語や不快な単語のリストを指定すると、Amazon Transcribe はそれらをトランスクリプトから自動的に削除します。

保管中のデータを保護するには、Amazon S3 キー (SSE-S3) を使用するか、独自の AWS Key Management Service キーを指定します。Amazon Transcribe は、TLS (Transport Layer Security) 1.2 を使用します。TLS (Transport Layer Security) 1.2 は、AWS 証明書を使用して、HTTP 経由で認証された接続とインターネット上での安全なデータ転送を可能にする暗号化プロトコルであり、転送中のデータを暗号化します。これにはストリーミング文字起こしも含まれます。 

指示があった場合、Amazon Transcribe は、サポートされている言語の文字起こし原稿から個人を特定できる情報 (PII) を識別してマスキング作業をお客様が行うのを支援できます。これにより、コンタクトセンターは、カスタマー体験の洞察を得てエージェントトレーニングを行うために、トランスクリプトを簡単に確認して共有できます。

Amazon Transcribe Toxicity Detection は、機械学習を使用して音声会話を礼儀正しく建設的に保ち、安全で包括的なオンライン環境を促進します。有害な音声コンテンツは、人間のモデレーターが簡単に特定して適切な措置を講じられるように、いくつかのカテゴリのいずれかにフラグが立てられます。 

Transcribe Call Analytics

お客様との会話の重要な部分 (問題、結果、アクションアイテムなど) を自動的に記録することで、エージェントが優れたカスタマーエクスペリエンスの提供に集中できるよう通話要約を生成し、通話後の生産性を向上させることができます。マネージャーは、トランスクリプト全体を確認しなくても、これらの要約をすばやく確認して、やり取りの状況を理解し、お客様の問題を調査することができます。

機械学習の力を利用すると、音声テキスト化機能や自然言語処理機能を迅速に適用して、会話に関する貴重なインサイトを得ることができます。その後、お客様とエージェントの感情、検出された問題、会話がない時間、中断、話す速度などの音声特性といったインサイトを着信および発信の通話分析アプリケーションに統合することができます。これにより、スーパーバイザーは、潜在的なお客様の問題、エージェントのコーチング機会、通話の傾向などをより簡単に特定できるようになります。

会社のポリシーまたは規制要件の遵守のために、通話を大規模にモニタリングします。指定した条件 (語句や会話の特性など) に基づき、独自のカスタムカテゴリを構築し、トレーニングします。例えば、カテゴリラベルを設定して、コールのうち何 % がアップセルやアカウントのキャンセルなのかを確認できます。

エージェントが過去のやり取りの会話の詳細にアクセスできるようにします。ターンバイターンのトランスクリプトは、顧客の感情、検出された問題、中断などのインサイトを提供します。

Transcribe Medical

医療ディクテーションのユースケースでよく見られるシングルスピーカーの音声を正確に書き起こします。 詳細を確認する

臨床医や患者からなるマルチスピーカーの会話音声を正確に文字に起こします。 詳細を確認する

さまざまな医療専門分野にわたって音声をテキストに書き起こします。 詳細を確認する

記録された医療音声ファイルを高い同時実行性で大規模に文字起こしします。 詳細を確認する

辞書に載っていない可能性のある用語に対してカスタム語彙を使用することで、書き起こしの精度を高めます。 詳細を確認する

モノラルチャネル音声内のさまざまな話者からの音声を分離します。 詳細を確認する