Amazon Bedrock インテリジェントプロンプトルーティング

概要

Amazon Bedrock インテリジェントプロンプトルーティングは、モデルファミリー内のさまざまな基盤モデルにプロンプトをルーティングし、応答の質とコストを最適化するのをサポートします。インテリジェントプロンプトルーティングを使用すると、精度を損なうことなくコストを最大 30% 削減できます。

より低いコストでパフォーマンスを最大化

デベロッパーにとって、どのクエリにより高度なモデルが必要なのか、またはより小さく、高速で、低コストのモデルで機能するのかを把握することは難しい場合があります。インテリジェントプロンプトルーティングは、高度なプロンプトマッチングとモデル理解の手法を用いて、各リクエストにおける各モデルのパフォーマンスを予測し、最も低いコストで必要な応答を返す可能性が最も高いと予測されるモデルに対して、各リクエストを動的にルーティングします。Claude Sonnet 3.5 と Claude Haiku の間、または Llama 3.1 7B と Llama 3.1 80B の間のいずれかのリクエストをルーティングする 2 つのプロンプトルーター (プレビュー) から選択できます。

開発作業を削減

アプリケーションで必要なパフォーマンスとコストを実現するには、多くの場合、複雑なオーケストレーションワークフローを開発し、精度の点で必要なパフォーマンスを実現するために、経験に基づいて各リクエストを最適なモデルにルーティングする必要があります。インテリジェントプロンプトルーティングを使用すると、さまざまなモデルのテストと複雑なオーケストレーションワークフローの作成にかかる数か月分の労力を節約できます。