ある金融サービス会社は、クレジットカードのサービシング・パートナーから定期的なデータフィードを受信しています。約 5,000 件のレコードが 15 分ごとに平文で送信され、サーバー側で暗号化された Amazon S3 バケットに HTTPS 経由で直接送信されます。このフィードには、機密性の高いクレジットカードのプライマリアカウント番号(PAN)データが含まれています。同社は、データを別の S3 バケットに送信して内部処理を追加する前に、PAN を自動的にマスクする必要があります。また、特定のフィールドを削除してマージし、レコードを JSON 形式に変換する必要があります。さらに、将来的にフィードが追加される可能性があるため、簡単に拡張できる設計が必要です。これらの要件を満たすソリューションは?
A. ファイル配信時にAWS Lambda関数をトリガーし、各レコードを抽出してAmazon SQSキューに書き込む SQSキューに新しいメッセージが到着すると、別のLambda関数をトリガーしてレコードを処理し、結果をAmazon S3の一時的な場所に書き込む SQSキューが空になると、最後のLambda関数をトリガーしてレコードをJSON形式に変換し、結果を内部処理のために別のS3バケットに送信する n
B. ファイル配信時にAWS Lambda関数をトリガーし、各レコードを抽出してAmazon SQSキューに書き込む AWS Fargateコンテナアプリケーションを構成し、SQSキューにメッセージが含まれるときに自動的に単一インスタンスにスケールさせる アプリケーションに各レコードを処理させ、レコードをJSON形式に変換させる キューが空になったら、内部処理のために別のS3バケットに結果を送信し、AWS Fargateインスタンスをスケールダウンさせる
C. データフィードのフォーマットに基づいて、AWS Glueクローラーとカスタム分類器を作成し、一致するテーブル定義を構築する ファイル配信時にAWS Lambda関数をトリガーして、AWS Glue ETLジョブを開始し、処理要件と変換要件に従ってレコード全体を変換する 出力形式をJSONと定義する ETLジョブが完了したら、内部処理用に別のS3バケットに結果を送信する
D. データフィードのフォーマットに基づいてAWS Glueクローラーとカスタム分類器を作成し、一致するテーブル定義を構築する ファイル配信時にAmazon Athenaクエリを実行してAmazon EMR ETLジョブを開始し、処理および変換要件に従ってレコード全体を変換する 出力形式をJSONと定義する 完了したら、内部処理用に別のS3バケットに結果を送信し、EMRクラスタをスケールダウンする