ある通信会社が、顧客向けのモバイルアプリを開発している。同社は、機械学習モデルの推論に Amazon SageMaker ホスティングエンドポイントを使用しています。開発者は、アプリのプレビュー機能に登録した限られたユーザーに対して、モデルの新バージョンを導入したいと考えています。新バージョンのモデルがプレビューとしてテストされた後、開発者はその精度を評価します。新バージョンのモデルの方が精度が高い場合、開発者は新バージョンを徐々にリリースできるようにする必要があります。
A. InitialVariantWeightパラメータを0に設定したCreateEndpointConfig操作を使用して、ProductionVariantデータタイプをモデルの新バージョンで更新します。プレビュー機能をサブスクライブしたユーザに対して、InvokeEndpoint呼び出しのTargetVariantパラメータを指定します。モデルの新バージョンをリリースする準備ができたら、すべてのユーザーが更新バージョンを使用できるようになるまで、InitialVariantWeight を徐々に増やします。
B. 異なるバージョンのモデルを提供する2つのSageMakerホストエンドポイントを構成します。TargetVariant クエリ文字列パラメータに基づいて両方のエンドポイントにトラフィックをルーティングするために、アプリケーション・ロード・バランサー(ALB)を作成します。プレビュー機能を購読したユーザーに対して、TargetVariant クエリ文字列パラメータを送信するようにアプリを再設定します。モデルの新しいバージョンがリリースできるようになったら、すべてのユーザーが更新されたバージョンを持つまで、ALB のルーティング・アルゴリズムを重み付けに変更します。
C. DesiredWeight パラメータを 0 に設定して UpdateEndpointWeightsAndCapacities 操作を使用し、DesiredWeightsAndCapacity データ型をモデルの新しいバージョンで更新します。プレビュー機能をサブスクライブしたユーザの InvokeEndpoint 呼び出しの TargetVariant パラメータを指定します。モデルの新しいバージョンがリリースできるようになったら、すべてのユーザーが更新されたバージョンを持つまで、DesiredWeight を徐々に増やします。
D. 異なるバージョンのモデルを提供する2つのSageMakerホストエンドポイントを構成します。単純なルーティングポリシーで構成され、モデルの現在のバージョンを指す Amazon Route 53 レコードを作成します。プレビュー機能を購読したユーザにはエンドポイントURLを使用し、その他のユーザにはRoute 53レコードを使用するようにモバイルアプリを構成します。モデルの新しいバージョンがリリースの準備ができたら、新しいモデルのバージョンのエンドポイントをRoute 53に追加し、すべてのユーザが更新されたバージョンを持つまで、ポリシーをウェイトに切り替えます。