Uma empresa de retalho online está a migrar o seu sistema de relatórios para o AWS. O sistema antigo da empresa executa o processamento de dados em transacções online utilizando uma série complexa de consultas Apache Hive aninhadas. Os dados transaccionais são exportados do sistema online para o sistema de relatórios várias vezes por dia. Os esquemas nos ficheiros são estáveis entre actualizações. Um analista de dados deseja migrar rapidamente o processamento de dados para o AWS, portanto, qualquer alteração de código deve ser minimizada. Para manter os custos de armazenamento baixos, o analista de dados decide armazenar t
A. Crie um catálogo de dados do AWS Glue para gerenciar o metadado do Hive
B. Criar um rastreador AWS Glue no Amazon S3 que é executado quando os dados são actualizados para garantir que as alterações de dados são actualizadas
C. Crie um cluster do Amazon EMR e use os metadados no Catálogo de dados do AWS Glue para executar consultas de processamento do Hive no Amazon EMR
D. Criar um catálogo de dados do AWS Glue para gerenciar o metadado do Hive
E. Criar um cluster do Amazon EMR com habilitação de visualização consistente
F. Execute a sincronização do emrfs antes de cada etapa de análise para garantir que as alterações de dados sejam atualizadas G