Q22: ある小売チェーンは、Amazon Kinesis Data Firehoseを使用して、20,000店舗のネットワークからAmazon S3に購買レコードを取り込んでいます。改善された機械学習モデルのトレーニングをサポートするために、トレーニングレコードは新しいが単純な変換を必要とし、いくつかの属性は結合される。モデルは毎日再トレーニングされる必要がある。ストアの数が多く、レガシーなデータ取り込みを考えると、どの変更が最も少ない開発工数で済むでしょうか?
A. ストアは、Amazon S3にロードするためにAWS Storage Gateway上でローカルにデータをキャプチャし、AWS Glueを使って変換するように切り替える必要がある。
B. 変換ロジックでApache Sparkを実行するAmazon EMRクラスタをデプロイし、Amazon S3に蓄積されたレコードに対してクラスタを毎日実行させ、新しい/変換されたレコードをAmazon S3に出力する。
C. 変換ロジックを持つAmazon EC2インスタンスをスピンアップし、Amazon S3に蓄積されたデータレコードを変換させ、変換されたレコードをAmazon S3に出力する。
D. SQL を使用して生のレコード属性を単純な変換値に変換する Amazon Kinesis Data Analytics ストリームを Kinesis Data Firehose ストリームの下流に挿入します。