NÃO QUER PERDER NADA?

Dicas para passar no exame de certificação

Últimas notícias sobre exames e informações sobre descontos

Curadoria e atualizada por nossos especialistas

Sim, me envie o boletim informativo

Passe no exame da AWS facilmente com as perguntas práticas atualizadas do MLS-C01

Prepare-se efetivamente para o exame SPOTO AWS MLS-C01 com nossa coleção abrangente de perguntas e respostas de exames adaptadas para o sucesso. Nossas perguntas de teste abrangem os principais tópicos essenciais para a certificação AWS Certified Machine Learning - Specialty, garantindo uma preparação completa e confiança no dia do exame. Aceda a valiosos recursos de exame e materiais de estudo concebidos para melhorar a sua compreensão da criação, formação, otimização e implementação de modelos de aprendizagem automática na plataforma AWS. Nosso foco é fornecer a você as ferramentas e o conhecimento necessários para passar com sucesso, demonstrando sua experiência na implementação de iniciativas de aprendizado de máquina baseadas em nuvem.

Faça outros exames online

Pergunta #1
Um fabricante de motores de automóveis recolhe dados de automóveis enquanto estes estão a ser conduzidos. Os dados recolhidos incluem o registo da hora, a temperatura do motor, as rotações por minuto (RPM) e outras leituras dos sensores. A empresa pretende prever quando é que um motor vai ter um problema, de modo a poder notificar os condutores com antecedência para que façam a manutenção do motor. Os dados do motor são carregados num lago de dados para treino. Qual é o modelo de previsão MAIS adequado que pode ser implementado na produção?
A. Adicionar etiquetas ao longo do tempo para indicar quais as avarias do motor que ocorrem e em que altura no futuro para transformar isto num problema de aprendizagem supervisionada
B. Estes dados requerem um algoritmo de aprendizagem não supervisionado
C. Adicionar etiquetas ao longo do tempo para indicar quais as falhas do motor que ocorrem e em que altura no futuro para transformar isto num problema de aprendizagem supervisionada
D. Estes dados já estão formulados como uma série cronológica
Ver resposta
Resposta correta: A
Pergunta #2
Um cientista de dados precisa de identificar contas de utilizador fraudulentas para a plataforma de comércio eletrónico de uma empresa. A empresa pretende ter a capacidade de determinar se uma conta recém-criada está associada a um utilizador fraudulento previamente conhecido. O cientista de dados está a utilizar o AWS Glue para limpar os registos de aplicações da empresa durante a ingestão
A. Executar a consulta incorporada FindDuplicates do Amazon Athena
B. riar uma transformação de aprendizagem automática FindMatches no AWS Glue
C. riar um rastreador AWS Glue para inferir contas duplicadas nos dados de origem
D. rocurar contas duplicadas no catálogo de dados do AWS Glue
Ver resposta
Resposta correta: B
Pergunta #3
Uma empresa de retalho pretende utilizar a aprendizagem automática para categorizar novos produtos. Um conjunto de dados rotulado de produtos actuais foi fornecido à equipa de Ciência de Dados. O conjunto de dados inclui 1.200 produtos. O conjunto de dados rotulado tem 15 características para cada produto, tais como dimensões do título, peso e preço. Cada produto é rotulado como pertencente a uma de seis categorias, como livros, jogos, eletrónica e filmes. Que modelo deve ser utilizado para categorizar novos produtos utilizando o conjunto de dados fornecido para treino?
A. Um modelo XGBoost em que o parâmetro do objetivo é definido como multi:softmax
B. Uma rede neural convolucional profunda (CNN) com uma função de ativação softmax para a última camada
C. Uma floresta de regressão em que o número de árvores é igual ao número de categorias de produtos
D. Um modelo de previsão DeepAR baseado numa rede neural recorrente (RNN)
Ver resposta
Resposta correta: A
Pergunta #4
Um cientista de dados utiliza uma instância de notebook do Amazon SageMaker para realizar a exploração e análise de dados. Para tal, é necessário instalar na instância do notebook determinados pacotes Python que não estão disponíveis nativamente no Amazon SageMaker. Como é que um especialista em aprendizagem automática pode garantir que os pacotes necessários estão automaticamente disponíveis na instância do notebook para serem utilizados pelo cientista de dados?
A. Instale o Agente do AWS Systems Manager na instância subjacente do Amazon EC2 e use a Automação do Systems Manager para executar os comandos de instalação do pacote
B. Crie um ficheiro de bloco de notas Jupyter (
C. tilize o gestor de pacotes conda a partir da consola do bloco de notas Jupyter para aplicar os pacotes conda necessários ao kernel predefinido do bloco de notas
D. riar uma configuração de ciclo de vida do Amazon SageMaker com comandos de instalação de pacotes e atribuir a configuração de ciclo de vida à instância do notebook
Ver resposta
Resposta correta: D
Pergunta #5
Um especialista em aprendizagem automática trabalha para uma empresa de processamento de fruta e precisa de criar um sistema que categorize as maçãs em três tipos. O especialista recolheu um conjunto de dados que contém 150 imagens para cada tipo de maçã e aplicou a aprendizagem por transferência numa rede neural que foi pré-treinada no ImageNet com este conjunto de dados. A empresa exige uma precisão de pelo menos 85% para utilizar o modelo. Após uma pesquisa exaustiva na grelha, os hiperparâmetros óptimos produziram o seguinte: -68% de precisão no conjunto de treino-67
A. Converter as imagens em escala de cinzentos e treinar novamente o modelo
B. Reduzir o número de itens distintos de 10 para 2, construir o modelo e iterar
C. Colocar etiquetas de cores diferentes em cada item, tirar novamente as imagens e construir o modelo
D. Aumentar os dados de treino para cada item utilizando variantes de imagem como inversões e traduções, construir o modelo e iterar
Ver resposta
Resposta correta: B
Pergunta #6
Um especialista em aprendizagem automática concluiu uma prova de conceito para uma empresa utilizando uma pequena amostra de dados e agora está pronto para implementar uma solução completa no AWS utilizando o Amazon SageMaker. Os dados históricos de treino estão armazenados no Amazon RDS. Que abordagem deve o especialista utilizar para treinar um modelo utilizando esses dados?
A. Escrever uma ligação direta à base de dados SQL no bloco de notas e obter dados
B. Enviar os dados do Microsoft SQL Server para o Amazon S3 utilizando um AWS Data Pipeline e fornecer a localização do S3 no bloco de notas
C. Mover os dados para o Amazon DynamoDB e configurar uma ligação ao DynamoDB no bloco de notas para obter dados
D. Mova os dados para o Amazon ElastiCache utilizando o AWS DMS e configure uma ligação no bloco de notas para obter dados para acesso rápido
Ver resposta
Resposta correta: B
Pergunta #7
Uma empresa está a criar um modelo de manutenção preditiva baseado na aprendizagem automática (ML). Os dados são armazenados num bucket Amazon S3 totalmente privado que é encriptado em repouso com CMKs do AWS Key Management Service (AWS KMS). Um especialista em ML deve executar o pré-processamento de dados utilizando uma tarefa do Amazon SageMaker Processing que é accionada a partir do código num bloco de notas do Amazon SageMaker. A tarefa deve ler os dados do Amazon S3, processá-los e carregá-los novamente no mesmo bucket do S3. O código de pré-processamento é armazenado numa imagem de contentor
A. rie uma função IAM com permissões para criar tarefas de processamento do Amazon SageMaker, acesso de leitura e gravação S3 ao bucket S3 relevante e permissões KMS e ECR apropriadas
B. rie uma função IAM com permissões para criar tarefas de processamento do Amazon SageMaker
C. Crie uma função IAM com permissões para criar tarefas de processamento do Amazon SageMaker e para aceder ao Amazon ECR
D. Crie uma função IAM que tenha permissões para criar tarefas de processamento do Amazon SageMaker
Ver resposta
Resposta correta: D
Pergunta #8
Um especialista em aprendizagem automática está a trabalhar com uma grande empresa para utilizar a aprendizagem automática nos seus produtos. A empresa pretende agrupar os seus clientes em categorias com base nos clientes que irão ou não abandonar o serviço nos próximos 6 meses. A empresa rotulou os dados disponíveis para o especialista. Que tipo de modelo de aprendizagem automática deve o especialista utilizar para realizar esta tarefa?
A. Regressão linear
B. Classificação
C. Agrupamento
D. Aprendizagem por reforço
Ver resposta
Resposta correta: B
Pergunta #9
Um especialista em aprendizagem automática (ML) está a administrar um ponto final de produção do Amazon SageMaker com monitorização de modelos configurada. O Monitor de modelos do Amazon SageMaker detecta violações no ponto de extremidade do SageMaker, portanto, o especialista em ML treina novamente o modelo com o conjunto de dados mais recente. Este conjunto de dados é estatisticamente representativo do tráfego de produção atual. O especialista em ML nota que, mesmo depois de implementar o novo modelo SageMaker e executar o primeiro trabalho de monitorização, o ponto final do SageMaker ainda tem violações
A. Acionar manualmente o trabalho de monitoramento para reavaliar a amostra de tráfego do ponto de extremidade do SageMaker
B. xecute o trabalho de linha de base do Monitor de Modelos novamente no novo conjunto de treinamento
C. liminar o ponto final e recriá-lo com a configuração original
D. Treinar novamente o modelo utilizando uma combinação do conjunto de treino original e do novo conjunto de treino
Ver resposta
Resposta correta: B
Pergunta #10
Uma empresa utiliza imagens de câmara da parte superior dos artigos expostos nas prateleiras das lojas para determinar quais os artigos que foram removidos e quais os que ainda permanecem. Após várias horas de etiquetagem de dados, a empresa tem um total de 1000 imagens etiquetadas à mão que abrangem 10 artigos distintos. Os resultados da formação foram fracos. Que abordagem de aprendizagem automática satisfaz as necessidades da empresa a longo prazo?
A. Uma estratégia de validação cruzada k-fold com k=5
B. Uma estratégia de validação cruzada k-fold estratificada com k=5
C. Uma estratégia de validação cruzada k-fold com k=5 e 3 repetições
D. Uma divisão estratificada 80/20 entre formação e validação
Ver resposta
Resposta correta: D
Pergunta #11
Um especialista em aprendizagem automática deve criar um modelo de reconhecimento de imagem supervisionado para identificar um gato. O especialista em aprendizagem automática efectua alguns testes e regista os seguintes resultados para um classificador de imagens baseado numa rede neural:Número total de imagens disponíveis = 1.000Imagens do conjunto de teste = 100 (conjunto de teste constante)O especialista em aprendizagem automática repara que, em mais de 75% das imagens mal classificadas, os gatos foram segurados de cabeça para baixo pelos seus donos.Que técnicas podem ser utilizadas pelo especialista em aprendizagem automática para melhorar este erro de teste específico?
A. Aumentar os dados de treino adicionando variação na rotação das imagens de treino
B. Aumentar o número de épocas para a formação do modelo
C. umentar o número de camadas da rede neural
D. umentar a taxa de desistência para a penúltima camada
Ver resposta
Resposta correta: A
Pergunta #12
Ao submeter tarefas de formação do Amazon SageMaker utilizando um dos algoritmos integrados, que parâmetros comuns DEVEM ser especificados? (Escolha três.)
A. Binarização
B. Codificação a quente
C. Tokenização
D. Transformação de normalização
Ver resposta
Resposta correta: AEF
Pergunta #13
Um especialista em aprendizagem automática está a conceber um sistema para melhorar as vendas de uma empresa. O objetivo é utilizar a grande quantidade de informações de que a empresa dispõe sobre o comportamento dos utilizadores e as preferências de produtos para prever quais os produtos de que os utilizadores gostariam com base na semelhança dos utilizadores com outros utilizadores
A. riar um motor de recomendação de filtragem baseado em conteúdo com o Apache Spark ML no Amazon EMR
B. Criar um motor de recomendação de filtragem colaborativa com o Apache Spark ML no Amazon EMR
C. riar um motor de recomendação de filtragem baseado em modelos com o Apache Spark ML no Amazon EMR
D. riar um motor de recomendação de filtragem combinada com o Apache Spark ML no Amazon EMR
Ver resposta
Resposta correta: B
Pergunta #14
Uma empresa está a converter um grande número de recibos de papel não estruturados em imagens. A empresa pretende criar um modelo baseado no processamento de linguagem natural (PNL) para encontrar entidades relevantes, como a data, o local e as notas, bem como algumas entidades personalizadas, como os números dos recibos. No entanto, os documentos têm estruturas e formatos diferentes, e a empresa está a enfrentar desafios na criação de fluxos de trabalho manuais para cada um deles
A. xtrair texto de imagens de recibos utilizando o Amazon Textract
B. Extrair texto de imagens de recibos utilizando um modelo de OCR de aprendizagem profunda do AWS Marketplace
C. xtrair texto de imagens de recibos utilizando o Amazon Textract
D. xtrair texto de imagens de recibos utilizando um modelo de OCR de aprendizagem profunda do AWS Marketplace
Ver resposta
Resposta correta: C
Pergunta #15
Um especialista em aprendizagem automática está a aplicar um modelo de regressão linear de mínimos quadrados a um conjunto de dados com 1.000 registos e 50 características. Antes do treino, o especialista em aprendizagem automática repara que duas características são perfeitamente dependentes de forma linear. Porque é que isto pode ser um problema para o modelo de regressão linear de mínimos quadrados?
A. Pode fazer com que o algoritmo de retropropagação falhe durante o treino
B. Pode criar uma matriz singular durante a otimização, o que não permite definir uma solução única
C. Pode modificar a função de perda durante a otimização, provocando falhas durante a formação
D. Poderia introduzir dependências não lineares nos dados, o que poderia invalidar os pressupostos lineares do modelo
Ver resposta
Resposta correta: C
Pergunta #16
Uma empresa de comércio eletrónico pretende lançar uma nova funcionalidade de recomendação de produtos baseada na nuvem para a sua aplicação Web. Devido aos regulamentos de localização de dados, quaisquer dados confidenciais não devem sair do seu centro de dados local e o modelo de recomendação de produtos deve ser treinado e testado usando apenas dados não confidenciais. A transferência de dados para a nuvem deve usar IPsec. A aplicação Web está alojada no local com uma base de dados PostgreSQL que contém todos os dados. A empresa pretende que os dados sejam carregados de forma segura para o Amazon S3 e
A. Crie um trabalho do AWS Glue para se conectar à instância do banco de dados PostgreSQL
B. Criar um trabalho do AWS Glue para se conectar à instância do banco de dados PostgreSQL
C. Utilizar o AWS Database Migration Service (AWS DMS) com mapeamento de tabelas para selecionar tabelas PostgreSQL sem dados sensíveis através de uma ligação SSL
D. Utilizar a replicação lógica do PostgreSQL para replicar todos os dados para o PostgreSQL no Amazon EC2 através do AWS Direct Connect com uma ligação VPN
Ver resposta
Resposta correta: C
Pergunta #17
Uma empresa de fabrico tem dados estruturados e não estruturados armazenados num bucket do Amazon S3. Um especialista em aprendizagem automática pretende utilizar SQL para executar consultas nestes dados. Qual é a solução que exige MENOS esforço para poder consultar estes dados?
A. Utilize o AWS Data Pipeline para transformar os dados e o Amazon RDS para executar consultas
B. Utilizar o AWS Glue para catalogar os dados e o Amazon Athena para executar consultas
C. Utilizar o AWS Batch para executar ETL nos dados e o Amazon Aurora para executar as consultas
D. Utilizar o AWS Lambda para transformar os dados e o Amazon Kinesis Data Analytics para executar consultas
Ver resposta
Resposta correta: B
Pergunta #18
Um especialista em aprendizagem automática de uma empresa sensível à segurança está a preparar um conjunto de dados para o treino de modelos. O conjunto de dados está armazenado no Amazon S3 e contém informações de identificação pessoal (PII). O conjunto de dados:-Deve ser acessível apenas a partir de uma VPC.-Não deve atravessar a Internet pública.Como é que estes requisitos podem ser satisfeitos?
A. Crie um ponto de extremidade de VPC e aplique uma política de acesso a buckets que restrinja o acesso ao ponto de extremidade de VPC fornecido e à VPC
B. rie um ponto de extremidade VPC e aplique uma política de acesso a buckets que permita o acesso a partir do ponto de extremidade VPC fornecido e de uma instância do Amazon EC2
C. Criar um ponto de extremidade VPC e utilizar listas de controlo de acesso à rede (NACLs) para permitir o tráfego apenas entre o ponto de extremidade VPC fornecido e uma instância do Amazon EC2
D. riar um ponto de extremidade VPC e usar grupos de segurança para restringir o acesso ao ponto de extremidade VPC fornecido e a uma instância do Amazon EC2
Ver resposta
Resposta correta: A
Pergunta #19
Um especialista em aprendizagem automática está a preparar dados para treino no Amazon SageMaker. O especialista está a utilizar um dos algoritmos incorporados no SageMaker para o treino. O conjunto de dados está armazenado no formato .CSV e é transformado numa matriz numpy.array, o que parece estar a afetar negativamente a velocidade do treino
A. Utilize a funcionalidade de transformação em lote do SageMaker para transformar os dados de treino num DataFrame
B. Utilizar o AWS Glue para comprimir os dados no formato Apache Parquet
C. ransformar o conjunto de dados no formato RecordIO protobuf
D. Utilize a funcionalidade de otimização de hiperparâmetros do SageMaker para otimizar automaticamente os dados
Ver resposta
Resposta correta: C
Pergunta #20
Um cientista de dados está a utilizar uma instância do notebook do Amazon SageMaker e precisa de aceder de forma segura aos dados armazenados num determinado bucket do Amazon S3
A. dicione uma política de bucket S3 que permita permissões GetObject, PutObject e ListBucket ao ARN do notebook do Amazon SageMaker como principal
B. riptografar os objetos no bucket S3 com uma chave personalizada do AWS Key Management Service (AWS KMS) à qual somente o proprietário do notebook tem acesso
C. nexar a política à função IAM associada ao bloco de notas que permite operações GetObject, PutObject e ListBucket para o bloco S3 específico
D. Use um script em uma configuração de ciclo de vida para configurar a CLI do AWS na instância com um ID de chave de acesso e um segredo
Ver resposta
Resposta correta: C
Pergunta #21
Um especialista em aprendizagem automática armazena dados de sensores de solo IoT na tabela Amazon DynamoDB e armazena dados de eventos meteorológicos como ficheiros JSON no Amazon S3. O conjunto de dados no DynamoDB tem 10 GB de tamanho e o conjunto de dados no Amazon S3 tem 5 GB de tamanho. O especialista pretende treinar um modelo nestes dados para ajudar a prever os níveis de humidade do solo em função dos eventos meteorológicos utilizando o Amazon SageMaker. Qual a solução que efectuará a transformação necessária para treinar o modelo do Amazon SageMaker com o MENOR volume de trabalho administrativo possível?
A. Iniciar um cluster do Amazon EMR
B. Rastrear os dados usando rastreadores do AWS Glue
C. tivar o Amazon DynamoDB Streams na tabela de sensores
D. Rastrear os dados usando rastreadores do AWS Glue
Ver resposta
Resposta correta: D
Pergunta #22
Um especialista em aprendizagem automática precisa de analisar comentários num site de notícias com utilizadores de todo o mundo. O especialista deve encontrar os tópicos mais discutidos nos comentários que estão em inglês ou espanhol (Escolha dois.)
A. Utilizar um algoritmo BlazingText da Amazon SageMaker para encontrar os tópicos independentemente da língua
B. Utilizar um algoritmo seq2seq do Amazon SageMaker para traduzir de espanhol para inglês, se necessário
C. Utilizar o Amazon Translate para traduzir de espanhol para inglês, se necessário
D. Utilizar o Amazon Translate para traduzir de espanhol para inglês, se necessário
E. Utilizar o Amazon Translate para traduzir de espanhol para inglês, se necessário
Ver resposta
Resposta correta: B
Pergunta #23
Um cientista de dados está a trabalhar numa aplicação que efectua uma análise de sentimentos. A precisão da validação é fraca, e o cientista de dados pensa que a causa pode ser um vocabulário rico e uma frequência média baixa de palavras no conjunto de dados
A. mazon Comprehend análise sintáctica e deteção de entidades
B. mazon SageMaker BlazingText modo cbow
C. Remoção de palavras de paragem e stemming do Natural Language Toolkit (NLTK)
D. Vectorizador de frequência inversa de documentos (TF-IDF) do Scikit-leam
Ver resposta
Resposta correta: D
Pergunta #24
Uma cadeia de retalho tem vindo a ingerir registos de compras da sua rede de 20.000 lojas para o Amazon S3 utilizando o Amazon Kinesis Data Firehose. Para apoiar o treino de um modelo de aprendizagem automática melhorado, os registos de treino necessitarão de transformações novas, mas simples, e alguns atributos serão combinados. Dado o grande número de lojas e a ingestão de dados antigos, que alteração exigirá o MENOR esforço de desenvolvimento?
A. Abandono escolar
B. Perda L1 suave
C. Softmax
D. Unidades lineares rectificadas (ReLU)
Ver resposta
Resposta correta: D
Pergunta #25
Um especialista em aprendizado de máquina deseja trazer um algoritmo personalizado para o Amazon SageMaker. O Especialista implementa o algoritmo num contentor Docker suportado pelo Amazon SageMaker. Como é que o Especialista deve empacotar o contentor Docker para que o Amazon SageMaker possa iniciar a formação corretamente?
A. Modificar o ficheiro bash_profile no contentor e adicionar um comando bash para iniciar o programa de formação
B. Usar a configuração CMD no Dockerfile para adicionar o programa de treinamento como um CMD da imagem
C. onfigurar o programa de formação como um ENTRYPOINT chamado train
D. opiar o programa de formação para o diretório /opt/ml/train
Ver resposta
Resposta correta: B
Pergunta #26
Uma empresa de telecomunicações está a desenvolver uma aplicação móvel para os seus clientes. A empresa está a utilizar um ponto de extremidade alojado no Amazon SageMaker para inferências de modelos de aprendizagem automática. Os programadores pretendem introduzir uma nova versão do modelo para um número limitado de utilizadores que subscreveram uma funcionalidade de pré-visualização da aplicação. Depois de a nova versão do modelo ser testada como uma pré-visualização, os programadores avaliarão a sua precisão. Se uma nova versão do modelo tiver uma melhor precisão, os programadores têm de ser capazes de lançar gradualmente a nova versão
A. ctualize o tipo de dados ProductionVariant com a nova versão do modelo utilizando a operação CreateEndpointConfig com o parâmetro InitialVariantWeight definido para 0
B. Configure dois pontos de extremidade hospedados no SageMaker que servem as diferentes versões do modelo
C. ctualize o tipo de dados DesiredWeightsAndCapacity com a nova versão do modelo utilizando a operação UpdateEndpointWeightsAndCapacities com o parâmetro DesiredWeight definido para 0
D. Configure dois pontos de extremidade hospedados no SageMaker que servem as diferentes versões do modelo
Ver resposta
Resposta correta: D
Pergunta #27
Uma empresa aprovisiona instâncias do notebook do Amazon SageMaker para a sua equipa de ciência de dados e cria pontos finais de interface do Amazon VPC para garantir a comunicação entre o VPC e as instâncias do notebook. Todas as conexões com a API do Amazon SageMaker são contidas inteiramente e de forma segura usando a rede AWS. No entanto, a equipa de ciência de dados apercebe-se de que as pessoas fora do VPC ainda se podem ligar às instâncias do notebook através da Internet
A. odifique o grupo de segurança das instâncias de notebook para permitir o tráfego apenas dos intervalos CIDR da VPC
B. rie uma política de IAM que permita as acções sagemaker:CreatePresignedNotebooklnstanceUrl e sagemaker:DescribeNotebooklnstance apenas a partir dos pontos finais VPC
C. dicione um gateway NAT ao VP Converta todas as sub-redes onde as instâncias de notebook do Amazon SageMaker estão hospedadas em sub-redes privadas
D. lterar a ACL de rede da sub-rede em que o notebook está hospedado para restringir o acesso a qualquer pessoa fora da VPC
Ver resposta
Resposta correta: B
Pergunta #28
Uma startup de tecnologia está a utilizar redes neurais profundas complexas e computação GPU para recomendar os produtos da empresa aos seus clientes existentes com base nos hábitos e interacções de cada cliente. Atualmente, a solução extrai cada conjunto de dados de um bucket Amazon S3 antes de carregar os dados para um modelo TensorFlow extraído do repositório Git da empresa que é executado localmente. Esta tarefa é depois executada durante várias horas, enviando continuamente o seu progresso para o mesmo contentor S3. O trabalho pode ser pausado, reiniciado e continuar
A. mplementar a solução usando AWS Deep Learning Containers e executar o contêiner como um trabalho usando AWS Batch em uma Instância Spot compatível com GPU
B. Implementar a solução usando uma instância do Amazon EC2 compatível com GPU de baixo custo e usar o AWS Instance Scheduler para agendar a tarefa
C. Implementar a solução usando AWS Deep Learning Containers, executar a carga de trabalho usando AWS Fargate em execução em instâncias Spot e, em seguida, agendar a tarefa usando o agendador de tarefas integrado
D. Implementar a solução utilizando o Amazon ECS em execução em Instâncias Spot e agendar a tarefa utilizando o agendador de serviços ECS
Ver resposta
Resposta correta: C
Pergunta #29
Um especialista em aprendizagem automática está a trabalhar com uma grande empresa de cibersegurança que gere eventos de segurança em tempo real para empresas de todo o mundo. A empresa de cibersegurança pretende conceber uma solução que lhe permita utilizar a aprendizagem automática para classificar eventos maliciosos como anomalias nos dados à medida que estes são ingeridos. A empresa também quer poder guardar os resultados no seu lago de dados para processamento e análise posteriores. Qual é a forma MAIS eficiente de realizar estas tarefas?
A. Ingerir os dados utilizando o Amazon Kinesis Data Firehose e utilizar o Amazon Kinesis Data Analytics Random Cut Forest (RCF) para deteção de anomalias
B. Ingerir os dados no Apache Spark Streaming utilizando o Amazon EMR e utilizar o Spark MLlib com k-means para efetuar a deteção de anomalias
C. ngerir os dados e armazená-los no Amazon S3
D. Ingerir os dados e armazená-los no Amazon S3
Ver resposta
Resposta correta: A
Pergunta #30
Um especialista em aprendizagem automática treinou previamente um modelo de regressão logística utilizando o scikit-learn numa máquina local, e o especialista pretende agora implementá-lo na produção apenas para inferência
A. Utilizar uma base de dados, como o Amazon DynamoDB, para armazenar as imagens e definir as políticas de IAM para restringir o acesso apenas aos utilizadores IAM pretendidos
B. Utilizar um lago de dados apoiado pelo Amazon S3 para armazenar as imagens em bruto e configurar as permissões utilizando políticas de balde
C. onfigurar o Amazon EMR com o HDFS (Hadoop Distributed File System) para armazenar os ficheiros e restringir o acesso às instâncias EMR utilizando políticas IAM
D. Configurar o Amazon EFS com políticas IAM para disponibilizar os dados às instâncias do Amazon EC2 pertencentes aos utilizadores IAM
Ver resposta
Resposta correta: A
Pergunta #31
O gráfico apresentado é de um modelo de previsão para testar uma série cronológica. Considerando apenas o gráfico, que conclusão deve um especialista em aprendizagem automática tirar sobre o comportamento do modelo?
A. O modelo prevê bem a tendência e a sazonalidade
B. O modelo prevê bem a tendência, mas não a sazonalidade
C. O modelo prevê bem a sazonalidade, mas não a tendência
D. O modelo não prevê bem a tendência ou a sazonalidade
Ver resposta
Resposta correta: A
Pergunta #32
Um especialista em aprendizagem automática está a criar um modelo de previsão para um grande número de características utilizando modelos lineares, como a regressão linear e a regressão logística. Durante a análise exploratória de dados, o especialista observa que muitas características estão altamente correlacionadas entre si. O que deve ser feito para reduzir o impacto de ter um número tão grande de características?
A. Efetuar a codificação num único instante em características altamente correlacionadas
B. Utilizar a multiplicação de matrizes em características altamente correlacionadas
C. riar um novo espaço de características utilizando a análise de componentes principais (PCA)
D. Aplicar o coeficiente de correlação de Pearson
Ver resposta
Resposta correta: C
Pergunta #33
Uma empresa de serviços financeiros está a criar um lago de dados sem servidor robusto no Amazon S3. O lago de dados deve ser flexível e atender aos seguintes requisitos:-Suportar a consulta de dados antigos e novos no Amazon S3 por meio do Amazon Athena e do Amazon Redshift Spectrum;-Suportar pipelines de ETL orientados por eventos;-Fornecer uma maneira rápida e fácil de entender os metadadosQual abordagem atende a esses requisitos?
A. Use um rastreador do AWS Glue para rastrear dados do S3, uma função do AWS Lambda para acionar um trabalho ETL do AWS Glue e um catálogo de dados do AWS Glue para pesquisar e descobrir metadados
B. Utilize um rastreador do AWS Glue para rastrear dados do S3, uma função do AWS Lambda para acionar um trabalho do AWS Batch e um metastore externo do Apache Hive para pesquisar e descobrir metadados
C. Use um rastreador do AWS Glue para rastrear dados do S3, um alarme do Amazon CloudWatch para acionar um trabalho do AWS Batch e um catálogo de dados do AWS Glue para pesquisar e descobrir metadados
D. Use um rastreador do AWS Glue para rastrear dados do S3, um alarme do Amazon CloudWatch para acionar um trabalho ETL do AWS Glue e um metastore externo do Apache Hive para pesquisar e descobrir metadados
Ver resposta
Resposta correta: A
Pergunta #34
Um especialista em aprendizagem automática está a desenvolver um modelo de recomendação de vídeo personalizado para uma aplicação. O conjunto de dados utilizado para treinar este modelo é muito grande, com milhões de pontos de dados, e está alojado num bucket do Amazon S3. O Especialista pretende evitar carregar todos estes dados numa instância de notebook do Amazon SageMaker porque demoraria horas a mover e excederia o volume de 5 GB do Amazon EBS anexado à instância do notebook
A. Carregue um subconjunto menor dos dados no bloco de notas do SageMaker e treine localmente
B. Inicie uma instância do Amazon EC2 com uma AMI do AWS Deep Learning e anexe o bucket S3 à instância
C. Use o AWS Glue para treinar um modelo usando um pequeno subconjunto dos dados para confirmar que os dados serão compatíveis com o Amazon SageMaker
D. Carregue um subconjunto menor dos dados no bloco de notas do SageMaker e treine localmente
Ver resposta
Resposta correta: A
Pergunta #35
Uma empresa pretende prever os preços de venda de casas com base nos dados históricos de vendas disponíveis. A variável-alvo no conjunto de dados da empresa é o preço de venda. As características incluem parâmetros como a dimensão do lote, as medidas da área habitável, as medidas da área não habitável, o número de quartos, o número de casas de banho, o ano de construção e o código postal. A empresa pretende utilizar a regressão linear multivariada para prever os preços de venda das casas. Que passo deve dar um especialista em aprendizagem automática para remover características que são irrelacionadas com o preço de venda?
A. Traçar um histograma das características e calcular o seu desvio padrão
B. Traçar um histograma das características e calcular o seu desvio padrão
C. onstruir um mapa de calor que mostre a correlação do conjunto de dados com ele próprio
D. Efetuar uma verificação da correlação de todas as características com a variável-alvo
Ver resposta
Resposta correta: D
Pergunta #36
Uma empresa de camionagem está a recolher dados de imagens em direto da sua frota de camiões em todo o mundo. Os dados estão a crescer rapidamente e são gerados cerca de 100 GB de novos dados todos os dias. A empresa pretende explorar casos de utilização de aprendizagem automática, assegurando simultaneamente que os dados só estão acessíveis a utilizadores IAM específicos. Qual a opção de armazenamento que oferece a maior flexibilidade de processamento e permite o controlo de acesso com o IAM?
A. Executar a auto-correlação em todas as características e remover as características altamente correlacionadas
B. Normalizar todos os valores numéricos para que fiquem entre 0 e 1
C. Utilizar um autoencoder ou uma análise de componentes principais (PCA) para substituir as características originais por novas características
D. Agrupar dados em bruto utilizando k-means e utilizar dados de amostra de cada agrupamento para criar um novo conjunto de dados
Ver resposta
Resposta correta: C
Pergunta #37
Uma empresa retalhista pretende combinar as encomendas dos seus clientes com os dados de descrição dos produtos do seu catálogo de produtos. A estrutura e o formato dos registos em cada conjunto de dados são diferentes. Um analista de dados tentou utilizar uma folha de cálculo para combinar os conjuntos de dados, mas o esforço resultou em registos duplicados e registos que não foram devidamente combinados. A empresa precisa de uma solução que possa ser utilizada para combinar registos semelhantes dos dois conjuntos de dados e remover quaisquer duplicados
A. Utilize uma função AWS Lambda para processar os dados
B. Criar rastreadores do AWS Glue para ler e preencher o catálogo de dados do AWS Glue
C. rie rastreadores do AWS Glue para ler e preencher o catálogo de dados do AWS Glue
D. Criar uma transformação personalizada do AWS Lake Formation
Ver resposta
Resposta correta: C
Pergunta #38
Uma empresa de comunicação social com um arquivo muito grande de imagens, texto, áudio e vídeo sem rótulos pretende indexar os seus activos para permitir a rápida identificação de conteúdos relevantes pela equipa de investigação. A empresa pretende utilizar a aprendizagem automática para acelerar os esforços dos seus investigadores internos, que têm conhecimentos limitados de aprendizagem automática
A. Utilizar o Amazon Rekognition, o Amazon Comprehend e o Amazon Transcribe para marcar dados em categorias/classes distintas
B. Criar um conjunto de tarefas de inteligência humana da Amazon Mechanical Turk para rotular todas as filmagens
C. Utilizar o Amazon Transcribe para converter o discurso em texto
D. Use a AMI do AWS Deep Learning e as instâncias de GPU do Amazon EC2 para criar modelos personalizados para transcrição de áudio e modelagem de tópicos, e use a deteção de objetos para marcar dados em categorias/classes distintas
Ver resposta
Resposta correta: A
Pergunta #39
Um especialista em aprendizagem automática (ML) tem de desenvolver um modelo de classificação para uma empresa de serviços financeiros. Um especialista do domínio fornece o conjunto de dados, que é tabular, com 10.000 linhas e 1.020 características. Durante a análise exploratória de dados, o especialista não encontra valores em falta e uma pequena percentagem de linhas duplicadas. Existem pontuações de correlação de > 0,9 para 200 pares de características. O valor médio de cada caraterística é semelhante ao seu percentil 50. Que estratégia de engenharia de características deve o especialista em ML utilizar com o Amazo
A. Aplicar a redução da dimensionalidade utilizando o algoritmo de análise de componentes principais (PCA)
B. Eliminar as características com pontuações de correlação baixas utilizando um bloco de notas Jupyter
C. Aplicar a deteção de anomalias utilizando o algoritmo Random Cut Forest (RCF)
D. Concatenar as características com pontuações de correlação elevadas utilizando um bloco de notas Jupyter
Ver resposta
Resposta correta: A
Pergunta #40
Uma empresa financeira está a tentar detetar fraudes com cartões de crédito. A empresa observou que, em média, 2% das transacções com cartões de crédito eram fraudulentas. Um cientista de dados treinou um classificador com base nos dados de um ano de transacções com cartões de crédito. O modelo tem de identificar as transacções fraudulentas (positivas) das regulares (negativas). O objetivo da empresa é captar com precisão o maior número possível de positivos. Que métricas deve o cientista de dados utilizar para otimizar o modelo? (Escolha duas.)
A. Remover as permissões de acesso ao Amazon S3 da função de execução do SageMaker
B. Encriptar os pesos do modelo CNN
C. ncriptar o conjunto de dados de treino e validação
D. tivar o isolamento da rede para os trabalhos de formação
Ver resposta
Resposta correta: AB
Pergunta #41
Um cientista de dados está a tentar melhorar a precisão de um modelo de classificação de rede neural. O cientista de dados quer executar um grande trabalho de ajuste de hiperparâmetros no Amazon SageMaker. No entanto, trabalhos anteriores de ajuste mais pequenos no mesmo modelo foram executados durante várias semanas. O especialista em ML pretende reduzir o tempo de computação necessário para executar a tarefa de afinação. Quais as acções que MAIS reduzirão o tempo de computação da tarefa de afinação de hiperparâmetros? (Seleccione DUAS.)
A. Utilizar a estratégia de sintonização Hyperband
B. Aumentar o número de hiperparâmetros
C. Definir um valor inferior para o parâmetro MaxNumberOfTrainingJobs
D. Utilizar a estratégia de afinação da pesquisa de grelha
E. Definir um valor inferior para o parâmetro MaxParallelTrainingJobs
Ver resposta
Resposta correta: AC
Pergunta #42
Um cientista de dados precisa criar uma solução de ingestão e análise sem servidor para dados de streaming em tempo real de alta velocidade. O processo de ingestão deve armazenar em buffer e converter os registros de entrada de JSON em um formato colunar otimizado para consulta sem perda de dados. O armazenamento de dados de saída deve estar altamente disponível, e os analistas devem poder executar consultas SQL nos dados e conectar-se a painéis de business intelligence existentes
A. rie um esquema no AWS Glue Data Catalog do formato de dados de entrada
B. screva cada registo JSON numa localização de preparação no Amazon S3
C. Escreva cada registo JSON numa localização de preparação no Amazon S3
D. Utilizar o Amazon Kinesis Data Analytics para ingerir os dados de fluxo contínuo e realizar consultas SQL em tempo real para converter os registos em Apache Parquet antes de os entregar ao Amazon S3
Ver resposta
Resposta correta: A
Pergunta #43
Uma empresa de serviços financeiros pretende adotar o Amazon SageMaker como o seu ambiente de ciência de dados predefinido. Os cientistas de dados da empresa executam modelos de aprendizagem automática (ML) em dados financeiros confidenciais. A empresa está preocupada com a saída de dados e pretende que um engenheiro de ML proteja o ambiente. Que mecanismos pode o engenheiro de ML utilizar para controlar a saída de dados do SageMaker? (Escolha três.)
A. Amazon EMR para a descoberta, enriquecimento e transformação de dados -Amazon Athena para consultar e analisar os resultados no Amazon S3 utilizando SQL padrão -Amazon QuickSight para elaborar relatórios e obter informações
B. Amazon Kinesis Data Analytics para ingestão de dados-Amazon EMR para descoberta, enriquecimento e transformação de dados-Amazon Redshift para consulta e análise dos resultados no Amazon S3
C. AWS Glue para a descoberta, enriquecimento e transformação de dados-Amazon Athena para consultar e analisar os resultados no Amazon S3 utilizando SQL padrão-Amazon QuickSight para elaborar relatórios e obter informações
D. AWS Data Pipeline para transferência de dados -AWS Step Functions para orquestrar tarefas AWS Lambda para descoberta, enriquecimento e transformação de dados -Amazon Athena para consulta e análise de resultados no Amazon S3 utilizando SQL padrão -Amazon QuickSight para elaboração de relatórios e obtenção de informações
Ver resposta
Resposta correta: BDF
Pergunta #44
Uma equipa de ciência de dados está a conceber um repositório de conjuntos de dados onde irá armazenar uma grande quantidade de dados de treino normalmente utilizados nos seus modelos de aprendizagem automática. Como os cientistas de dados podem criar um número arbitrário de novos conjuntos de dados todos os dias, a solução tem de ser dimensionada automaticamente e ser económica. Além disso, deve ser possível explorar os dados utilizando SQL. Qual é o esquema de armazenamento MAIS adaptado a este cenário?
A. O modelo precisa de ser completamente reformulado porque não é capaz de lidar com as alterações do inventário de produtos
B. Os hiperparâmetros do modelo devem ser actualizados periodicamente para evitar desvios
C. O modelo deve ser periodicamente treinado de novo a partir do zero, utilizando os dados originais e adicionando um termo de regularização para lidar com as alterações do inventário de produtos
D. O modelo deve ser periodicamente treinado novamente utilizando os dados de treino originais e novos dados à medida que o inventário de produtos se altera
Ver resposta
Resposta correta: A
Pergunta #45
Uma empresa está a criar uma aplicação de contagem de filas para utilização num restaurante de serviço rápido. A empresa pretende utilizar câmaras de vídeo apontadas para a fila de clientes numa determinada caixa registadora para medir o número de pessoas que estão na fila e enviar notificações aos gestores se a fila se tornar demasiado longa. As instalações do restaurante têm largura de banda limitada para ligações a serviços externos e não podem acomodar vários fluxos de vídeo sem afetar outras operações
A. Instalar câmaras compatíveis com o Amazon Kinesis Video Streams para transmitir os dados para o AWS através da ligação à Internet existente no restaurante
B. Implementar câmaras AWS DeepLens no restaurante para capturar vídeo
C. econhecido
D. Criar um modelo personalizado no Amazon SageMaker para reconhecer o número de pessoas numa imagem
E. Criar um modelo personalizado no Amazon SageMaker para reconhecer o número de pessoas numa imagem
Ver resposta
Resposta correta: A
Pergunta #46
Um banco global necessita de uma solução para prever se os clientes abandonarão o banco e escolherão outro banco. O banco está a utilizar um conjunto de dados para treinar um modelo para prever a perda de clientes. O conjunto de dados de treino tem 1.000 linhas. O conjunto de dados de treino inclui 100 instâncias de clientes que abandonaram o banco. Um especialista em aprendizagem automática (ML) está a utilizar o Amazon SageMaker Data Wrangler para treinar um modelo de previsão de churn através de uma tarefa de treino do SageMaker. Após o treino, o especialista em ML repara que o modelo devolve apenas falsos r
A. Aplicar a deteção de anomalias para remover os valores anómalos do conjunto de dados de treino antes do treino
B. Aplicar a técnica de sobreamostragem de minorias sintéticas (SMOTE) ao conjunto de dados de formação antes da formação
C. plicar a normalização às características do conjunto de dados de treino antes do treino
D. Aplicar uma subamostragem ao conjunto de dados de treino antes do treino
Ver resposta
Resposta correta: B
Pergunta #47
Um especialista em aprendizagem automática criou um modelo de aprendizagem profunda de classificação de imagens. No entanto, o especialista deparou-se com um problema de sobreajuste em que as precisões de treino e de teste eram de 99% e 75%, respetivamente. Como é que o especialista deve resolver este problema e qual é a razão por detrás dele?
A. mplementar uma função AWS Lambda para registar as chamadas da API do Amazon SageMaker no Amazon S3
B. Usar o AWS CloudTrail para registrar as chamadas da API do Amazon SageMaker no Amazon S3
C. Implementar uma função AWS Lambda para registar as chamadas da API do Amazon SageMaker no AWS CloudTrail
D. Utilizar o AWS CloudTrail para registar as chamadas da API do Amazon SageMaker no Amazon S3
Ver resposta
Resposta correta: B
Pergunta #48
Uma empresa de retalho está a utilizar o Amazon Personalize para fornecer recomendações de produtos personalizadas aos seus clientes durante uma campanha de marketing. A empresa vê um aumento significativo nas vendas de itens recomendados para os clientes existentes imediatamente após a implantação de uma nova versão da solução, mas essas vendas diminuem pouco tempo depois da implantação. Apenas os dados históricos de antes da campanha de marketing estão disponíveis para treinamento. Como um cientista de dados deve ajustar a solução?
A. tilize o rastreador de eventos no Amazon Personalize para incluir interacções do utilizador em tempo real
B. dicionar metadados do utilizador e utilizar a receita HRNN-Metadata no Amazon Personalize
C. mplementar uma nova solução usando o algoritmo de máquinas de factorização (FM) incorporado no Amazon SageMaker
D. dicionar campos de tipo de evento e valor de evento ao conjunto de dados de interacções no Amazon Personalize
Ver resposta
Resposta correta: A
Pergunta #49
Um especialista em aprendizagem automática recebe um projeto TensorFlow utilizando o Amazon SageMaker para formação e precisa de continuar a trabalhar durante um período prolongado sem acesso Wi-Fi
A. Instalar o Python 3 e o boto3 no seu computador portátil e continuar o desenvolvimento do código utilizando esse ambiente
B. Descarregar o contentor TensorFlow Docker utilizado no Amazon SageMaker do GitHub para o seu ambiente local e utilizar o Amazon SageMaker Python SDK para testar o código
C. Descarregue o TensorFlow de tensorflow
D. Descarregar o bloco de notas SageMaker para o ambiente local, instalar o Jupyter Notebooks no portátil e continuar o desenvolvimento num bloco de notas local
Ver resposta
Resposta correta: B
Pergunta #50
Uma equipa de Ciência de Dados de uma grande empresa utiliza notebooks Amazon SageMaker para aceder a dados armazenados em buckets Amazon S3. A equipa de Segurança de TI está preocupada com o facto de as instâncias de notebooks com acesso à Internet criarem uma vulnerabilidade de segurança em que o código malicioso executado nas instâncias poderia comprometer a privacidade dos dados. A empresa exige que todas as instâncias permaneçam dentro de um VPC seguro sem acesso à Internet, e o tráfego de comunicação de dados deve permanecer dentro da rede AWS
A. Associe o notebook do Amazon SageMaker a uma sub-rede privada em um VPC
B. ssocie o notebook do Amazon SageMaker a uma sub-rede privada em uma VPC
C. ssocie o notebook do Amazon SageMaker a uma sub-rede privada em uma VP Certifique-se de que a VPC tenha pontos de extremidade da VPC do S3 e pontos de extremidade da VPC do Amazon SageMaker anexados a ela
D. ssocie o notebook do Amazon SageMaker a uma sub-rede privada em uma VPC
Ver resposta
Resposta correta: C
Pergunta #51
Uma cidade pretende monitorizar a qualidade do ar para fazer face às consequências da poluição atmosférica. Um especialista em aprendizagem automática precisa de prever a qualidade do ar em partes por milhão de contaminantes para os próximos 2 dias na cidade. Como se trata de um protótipo, apenas estão disponíveis dados diários do último ano. Qual é o modelo com maior probabilidade de fornecer os melhores resultados no Amazon SageMaker?
A. Utilize o algoritmo k-Nearest-Neighbors (kNN) do Amazon SageMaker na série temporal única que consiste no ano completo de dados com um predictor_type de regressor
B. Utilizar o Amazon SageMaker Random Cut Forest (RCF) na série temporal única que consiste no ano completo de dados
C. Utilizar o algoritmo de Aprendizagem Linear do Amazon SageMaker na série temporal única que consiste no ano completo de dados com um predictor_type de regressor
D. Utilizar o algoritmo Linear Learner do Amazon SageMaker na série temporal única que consiste no ano completo de dados com um predictor_type de classificador
Ver resposta
Resposta correta: C
Pergunta #52
Uma empresa de fabrico de motores de aeronaves está a medir 200 métricas de desempenho numa série temporal. Os engenheiros querem detetar defeitos críticos de fabrico quase em tempo real durante os testes. Todos os dados têm de ser armazenados para análise offline. Qual seria a abordagem MAIS eficaz para efetuar a deteção de defeitos quase em tempo real?
A. Utilize o AWS IoT Analytics para ingestão, armazenamento e análise adicional
B. Utilizar o Amazon S3 para ingestão, armazenamento e análise posterior
C. Utilizar o Amazon S3 para ingestão, armazenamento e análise posterior
D. Utilizar o Amazon Kinesis Data Firehose para ingestão e o Amazon Kinesis Data Analytics Random Cut Forest (RCF) para efetuar a deteção de anomalias
Ver resposta
Resposta correta: B
Pergunta #53
Um especialista em aprendizagem automática está a criar uma nova aplicação de processamento de linguagem natural que processa um conjunto de dados composto por 1 milhão de frases. O objetivo é depois executar o Word2Vec para gerar embeddings das frases e permitir diferentes tipos de previsões. Aqui está um exemplo do conjunto de dados: "A raposa castanha rápida salta sobre o cão preguiçoso. "Quais das seguintes operações o Especialista precisa de executar para higienizar e preparar corretamente os dados de uma forma repetível? (Escolha três.)
A. onverter os documentos actuais em SSML com etiquetas de pronúncia
B. Criar um léxico de pronúncia adequado
C. Emitir marcas de fala para orientar a pronúncia
D. Utilizar o Amazon Lex para pré-processar os ficheiros de texto para pronúncia
Ver resposta
Resposta correta: BCF
Pergunta #54
Um cientista de dados precisa de migrar um processo ETL existente no local para a nuvem. O processo atual é executado em intervalos de tempo regulares e utiliza o PySpark para combinar e formatar várias fontes de dados de grande dimensão num único resultado consolidado para processamento a jusante. O cientista de dados recebeu os seguintes requisitos para a solução na nuvem:-Combinar várias fontes de dados;-Reutilizar a lógica PySpark existente;-Executar a solução no horário existente;-Minimizar o número de servidores que terão de ser geridos.Wh
A. Escreva os dados brutos no Amazon S3
B. Gravar os dados em bruto no Amazon S3
C. Gravar os dados brutos no Amazon S3
D. Utilizar o Amazon Kinesis Data Analytics para transmitir os dados de entrada e efetuar consultas SQL em tempo real no fluxo para realizar as transformações necessárias no fluxo
Ver resposta
Resposta correta: D
Pergunta #55
O especialista em aprendizagem automática de uma empresa precisa de melhorar a velocidade de formação de um modelo de previsão de séries temporais utilizando o TensorFlow. Atualmente, a formação é implementada numa máquina com uma única GPU e demora cerca de 23 horas a ser concluída. A precisão do modelo é aceitável, mas a empresa prevê um aumento contínuo no tamanho dos dados de treinamento e a necessidade de atualizar o modelo a cada hora, em vez de diariamente. A empresa também quer minimizar o esforço de codificação e
A. Não altere o código do TensorFlow
B. Alterar o código do TensorFlow para implementar uma estrutura distribuída Horovod suportada pelo Amazon SageMaker
C. Mudar para o uso de um modelo DeepAR integrado do AWS SageMaker
D. Mover a formação para o Amazon EMR e distribuir a carga de trabalho por tantas máquinas quantas as necessárias para atingir os objectivos comerciais
Ver resposta
Resposta correta: B
Pergunta #56
Dada a seguinte matriz de confusão para um modelo de classificação de filmes, qual é a frequência da classe verdadeira para Romance e a frequência da classe prevista para Aventura?
A. frequência de classe verdadeira para Romance é 77,56% e a frequência de classe prevista para Aventura é 20,85%
B. frequência de classe verdadeira para Romance é 57,92% e a frequência de classe prevista para Aventura é 13,12%
C. frequência de classe verdadeira para Romance é 0,78 e a frequência de classe prevista para Aventura é (0,47- 0,32)
D. A frequência de classe verdadeira para Romance é 77,56% * 0,78 e a frequência de classe prevista para Aventura é 20,85%*0,32
Ver resposta
Resposta correta: B
Pergunta #57
Um especialista em aprendizagem automática está a desenvolver um fluxo de trabalho ETL diário que contém vários trabalhos ETL. O fluxo de trabalho consiste nos seguintes processos:-Iniciar o fluxo de trabalho assim que os dados forem carregados para o Amazon S3.-Quando todos os conjuntos de dados estiverem disponíveis no Amazon S3, iniciar um trabalho ETL para juntar os conjuntos de dados carregados com vários conjuntos de dados de tamanho terabyte já armazenados no Amazon S3.-Armazenar os resultados da junção de conjuntos de dados no Amazon S3.-Se um dos trabalhos falhar, enviar uma notificação ao Administrador.Que configuração irá
A. Use o AWS Lambda para acionar um fluxo de trabalho do AWS Step Functions para aguardar a conclusão dos uploads de conjuntos de dados no Amazon S3
B. esenvolva o fluxo de trabalho ETL usando o AWS Lambda para iniciar uma instância do notebook do Amazon SageMaker
C. Desenvolver o fluxo de trabalho ETL utilizando o AWS Batch para acionar o início dos trabalhos ETL quando os dados são carregados para o Amazon S3
D. Use o AWS Lambda para encadear outras funções Lambda para ler e unir os conjuntos de dados no Amazon S3 assim que os dados forem carregados no Amazon S3
Ver resposta
Resposta correta: A
Pergunta #58
Um cientista de dados está a treinar uma perceção multicamada (MLP) num conjunto de dados com várias classes. A classe alvo de interesse é única em comparação com as outras classes do conjunto de dados, mas não atinge uma métrica de recuperação aceitável. O cientista de dados já tentou variar o número e o tamanho das camadas ocultas do MLP, o que não melhorou significativamente os resultados. Uma solução para melhorar a recuperação deve ser implementada o mais rápido possível. Quais técnicas devem ser usadas para atender a esses requisitos?
A. Recolher mais dados utilizando a Amazon Mechanical Turk e depois voltar a treinar
B. reinar um modelo de deteção de anomalias em vez de um MLP
C. Treinar um modelo XGBoost em vez de um MLP
D. Adicionar pesos de classe à função de perda do MLP e, em seguida, treinar novamente
Ver resposta
Resposta correta: D
Pergunta #59
Um especialista em aprendizagem automática recebe um conjunto de dados estruturado sobre os hábitos de compra da base de clientes de uma empresa. O conjunto de dados contém milhares de colunas de dados e centenas de colunas numéricas para cada cliente. O especialista quer identificar se há agrupamentos naturais para essas colunas em todos os clientes e visualizar os resultados o mais rápido possível
A. Incorporar as características numéricas utilizando o algoritmo t-SNE (t-distributed stochastic neighbor embedding) e criar um gráfico de dispersão
B. Executar k-means utilizando a medida de distância euclidiana para diferentes valores de k e criar um gráfico de cotovelo
C. Incorporar as características numéricas utilizando o algoritmo t-SNE (t-distributed stochastic neighbor embedding) e criar um gráfico de linhas
D. Executar o método k-means utilizando a medida de distância euclidiana para diferentes valores de k e criar gráficos de caixa para cada coluna numérica dentro de cada agrupamento
Ver resposta
Resposta correta: A
Pergunta #60
Uma grande empresa operadora de redes móveis está a construir um modelo de aprendizagem automática para prever os clientes que provavelmente deixarão de subscrever o serviço. A empresa planeia oferecer um incentivo a estes clientes, uma vez que o custo do cancelamento é muito superior ao custo do incentivo. O modelo produz a seguinte matriz de confusão após a avaliação de um conjunto de dados de teste de 100 clientes: Com base nos resultados da avaliação do modelo, por que razão é este um modelo viável para produção?
A. O modelo é 86% exato e o custo incorrido pela empresa devido a falsos negativos é inferior ao dos falsos positivos
B. A precisão do modelo é de 86%, o que é inferior à exatidão do modelo
C. O modelo é 86% exato e o custo incorrido pela empresa devido a falsos positivos é inferior ao dos falsos negativos
D. A precisão do modelo é de 86%, o que é superior à exatidão do modelo
Ver resposta
Resposta correta: A
Pergunta #61
Um especialista em aprendizagem automática trabalha para uma empresa de processamento de cartões de crédito e precisa de prever quais as transacções que podem ser fraudulentas quase em tempo real. Especificamente, o especialista tem de treinar um modelo que devolva a probabilidade de uma determinada transação ser fraudulenta. Como deve o especialista enquadrar este problema de negócio?
A. Classificação do fluxo contínuo
B. Classificação binária
C. Classificação multi-categorias
D. Classificação por regressão
Ver resposta
Resposta correta: C
Pergunta #62
Um especialista em aprendizagem automática está a construir um modelo para prever futuras taxas de emprego com base numa vasta gama de factores económicos. Ao explorar os dados, o especialista repara que a magnitude das características de entrada varia muito. O especialista não quer que as variáveis com uma magnitude maior dominem o modelo. O que é que o especialista deve fazer para preparar os dados para o treino do modelo?
A. Aplicar o agrupamento de quantis para agrupar os dados em intervalos categóricos para manter quaisquer relações nos dados, substituindo a magnitude pela distribuição
B. plicar a transformação do produto cartesiano para criar novas combinações de campos que sejam independentes da magnitude
C. Aplicar a normalização para garantir que cada campo terá uma média de 0 e uma variância de 1 para remover qualquer magnitude significativa
D. Aplicar a transformação ortogonal esparsa de bigramas (OSB) para aplicar uma janela deslizante de tamanho fixo para gerar novas características de magnitude semelhante
Ver resposta
Resposta correta: C
Pergunta #63
Um funcionário encontrou um clip de vídeo com áudio no feed das redes sociais de uma empresa. A língua utilizada no vídeo é o espanhol. O inglês é a primeira língua do funcionário e ele não entende espanhol. O funcionário quer fazer uma análise de sentimentos. Que combinação de serviços é a MAIS eficiente para realizar a tarefa?
A. Amazon Transcribe, Amazon Translate e Amazon Comprehend
B. Amazon Transcribe, Amazon Comprehend e Amazon SageMaker seq2seq
C. Modelo Neural de Tópicos (NTM) do Amazon Transcribe, Amazon Translate e Amazon SageMaker
D. Amazon Transcribe, Amazon Translate e Amazon SageMaker BlazingText
Ver resposta
Resposta correta: A
Pergunta #64
Durante o treino em mini-lotes de uma rede neural para um problema de classificação, um cientista de dados repara que a precisão do treino oscila. Qual é a causa mais provável deste problema?
A. A distribuição das classes no conjunto de dados é desequilibrada
B. A baralhação do conjunto de dados está desactivada
C. O tamanho do lote é demasiado grande
D. A taxa de aprendizagem é muito elevada
Ver resposta
Resposta correta: D
Pergunta #65
Uma empresa agrícola está interessada em utilizar a aprendizagem automática para detetar tipos específicos de ervas daninhas num campo de pastagem com 100 acres. Atualmente, a empresa utiliza câmaras montadas em tractores para captar várias imagens do campo em grelhas de 10 × 10. A empresa também tem um grande conjunto de dados de treino que consiste em imagens anotadas de classes populares de ervas daninhas, como as docas de folha larga e as docas de folha não larga. A empresa pretende criar um modelo de deteção de ervas daninhas que detecte tipos específicos de ervas daninhas e a localização de cada tipo no campo
A. Prepare as imagens no formato RecordIO e carregue-as para o Amazon S3
B. Prepare as imagens no formato Apache Parquet e carregue-as para o Amazon S3
C. Prepare as imagens no formato RecordIO e carregue-as para o Amazon S3
D. Prepare as imagens no formato Apache Parquet e carregue-as no Amazon S3
Ver resposta
Resposta correta: C
Pergunta #66
Um cientista de dados está a executar uma instância de notebook do Amazon SageMaker há algumas semanas. Durante este período, foi lançada uma nova versão do Jupyter Notebook, juntamente com actualizações de software adicionais. A equipa de segurança exige que todas as instâncias do notebook SageMaker em execução utilizem as actualizações de segurança e de software mais recentes fornecidas pelo SageMaker
A. hamar a operação da API CreateNotebookInstanceLifecycleConfig
B. riar uma nova instância do SageMaker notebook e montar o volume do Amazon Elastic Block Store (Amazon EBS) a partir da instância original
C. arar e depois reiniciar a instância do notebook SageMaker
D. hamar a operação da API UpdateNotebookInstanceLifecycleConfig
Ver resposta
Resposta correta: C
Pergunta #67
Uma empresa de comércio eletrónico está a automatizar a categorização dos seus produtos com base em imagens. Um cientista de dados treinou um modelo de visão computacional utilizando o algoritmo de classificação de imagens Amazon SageMaker. As imagens de cada produto são classificadas de acordo com linhas de produtos específicas. A precisão do modelo é demasiado baixa quando categoriza novos produtos. Todas as imagens de produtos têm as mesmas dimensões e são armazenadas num bucket do Amazon S3. A empresa pretende melhorar o modelo para que possa ser utilizado para novos produtos
A. As classes C e D são demasiado semelhantes
B. O conjunto de dados é demasiado pequeno para a validação cruzada de holdout
C. A distribuição dos dados é enviesada
D. O modelo está a ajustar-se demasiado às classes B e E
Ver resposta
Resposta correta: BCE

Ver as respostas após o envio

Por favor, envie seu e-mail e WhatsApp para obter respostas às perguntas.

Observação: certifique-se de que seu ID de e-mail e Whatsapp sejam válidos para que você possa obter os resultados corretos do exame.

E-mail:
WhatsApp/número de telefone: