あるオンライン小売企業は、レポーティングシステムをAWSに移行しようとしている。同社のレガシーシステムは、複雑なネストされた一連の Apache Hive クエリを使用してオンライントランザクションのデータ処理を実行している。トランザクションデータは1日に数回、オンラインシステムからレポートシステムにエクスポートされます。ファイル内のスキーマは更新間で安定しています。データアナリストは、データ処理を迅速にAWSに移行したいと考えているため、コードの変更は最小限に抑える必要がある。ストレージコストを低く抑えるために、データアナリストはt
A. Hiveメタデータを管理するAWS Glue Data Catalogを作成する
B. データの更新時に実行されるAWS GlueクローラーをAmazon S3上に作成し、データの変更が更新されるようにする。
C. Amazon EMRクラスタを作成し、AWS Glueデータカタログのメタデータを使用して、Amazon EMRでHive処理クエリを実行します。
D. AWS Glue Data Catalogを作成し、Hiveメタデータを管理する。
E. 一貫したビューを有効にするAmazon EMRクラスタを作成する
F. 各分析ステップの前にemrfs syncを実行し、データの変更が更新されるようにする G