NÃO QUER PERDER NADA?

Dicas para passar no exame de certificação

Últimas notícias sobre exames e informações sobre descontos

Curadoria e atualizada por nossos especialistas

Sim, me envie o boletim informativo

2024 Perguntas e testes práticos atualizados do exame MLS-C01, AWS Certified Machine Learning | SPOTO

Prepare-se para o sucesso no exame 2024 MLS-C01 com os testes práticos e as perguntas do exame actualizados da SPOTO. A certificação AWS Certified Machine Learning-Specialty (MLS-C01) é adaptada para profissionais em funções de desenvolvimento ou ciência de dados, validando suas habilidades na construção, treinamento, ajuste fino e implantação de modelos de aprendizado de máquina na nuvem da AWS. Domine as perguntas e respostas do exame para demonstrar proficiência em aproveitar os serviços da AWS para aplicativos de ML. Utilize testes práticos e lixeiras de exame para uma preparação abrangente e avaliação do seu conhecimento. Aceda a materiais de exame gratuitos e simuladores de exame para melhorar a sua prática e preparação para o exame. A SPOTO fornece uma gama de recursos, incluindo exemplos de perguntas e exames simulados, para o ajudar a destacar-se no exame MLS-C01 e a avançar na sua carreira no campo dinâmico da aprendizagem automática. Prepare-se com confiança e atinja os seus objectivos de certificação com o apoio da SPOTO.
Faça outros exames online

Pergunta #1
Um especialista em aprendizado de máquina inicia um trabalho de ajuste de hiperparâmetros para um modelo de conjunto baseado em árvore usando o AmazonSageMaker com a Área sob a curva ROC (AUC) como a métrica objetiva. Este fluxo de trabalho será eventualmente implementado numa linha de execução que retreina e ajusta os hiperparâmetros todas as noites para modelar o click-through em dados que se tornam obsoletos a cada 24 horas. Com o objetivo de diminuir o tempo necessário para treinar estes modelos e, em última análise, diminuir os custos, o Especialista pretende reconfigurar a hip
A. Um histograma que mostra se a caraterística de entrada mais importante é Gaussiana
B. Um gráfico de dispersão com pontos coloridos por variável-alvo que utiliza o t-Distributed Stochastic Neighbor Embedding (t-SNE) para visualizar o grande número de variáveis de entrada numa dimensão mais fácil de ler
C. Um gráfico de dispersão que mostra o desempenho da métrica objetiva em cada iteração de treino
D. Um gráfico de dispersão que mostra a correlação entre a profundidade máxima da árvore e a métrica objetiva
Ver resposta
Resposta correta: B
Pergunta #2
Uma empresa imobiliária está a lançar um novo produto que prevê os preços de novas casas. Os dados históricos das propriedades e dos preços são armazenados no formato .csv em um bucket do Amazon S3. Os dados têm um cabeçalho, alguns campos categóricos e alguns valores em falta. Os cientistas de dados da empresa utilizaram Python com uma biblioteca comum de código aberto para preencher os valores em falta com zeros. Os cientistas de dados eliminaram todos os campos categóricos e treinaram um modelo utilizando o algoritmo de regressão linear de código aberto
A. Crie uma função vinculada ao serviço para o Amazon Elastic Container Service (Amazon ECS) com acesso ao bucket S3
B. Crie um notebook do Amazon SageMaker com uma nova função IAM associada ao notebook
C. Crie uma função IAM com acesso ao Amazon S3, Amazon SageMaker e AWS Lambda
D. Crie uma função IAM para o Amazon SageMaker com acesso ao bucket S3
Ver resposta
Resposta correta: A
Pergunta #3
Um cientista de dados está a treinar um modelo de classificação de texto utilizando o algoritmo BlazingText incorporado no Amazon SageMaker. Existem 5 classes no conjunto de dados, com 300 amostras para a categoria A, 292 amostras para a categoria B, 240 amostras para a categoria C, 258 amostras para a categoria D e 310 amostras para a categoria E. O cientista de dados baralha os dados e separa 10% para teste. Depois de treinar o modelo, o cientista de dados gera matrizes de confusão para os conjuntos de treino e teste
A. As classes C e D são demasiado semelhantes
B. O conjunto de dados é demasiado pequeno para a validação cruzada de holdout
C. A distribuição dos dados é enviesada
D. O modelo está a ajustar-se demasiado às classes B e E
Ver resposta
Resposta correta: B
Pergunta #4
Um especialista em aprendizagem automática descobre as seguintes estatísticas enquanto faz experiências num modelo. O que é que o especialista pode retirar das experiências?
A. O modelo da Experiência 1 apresentava um erro de variância elevado que foi reduzido na Experiência 3 através da regularização A Experiência 2 mostra que o erro de desvio é mínimo na Experiência 1
B. O modelo na Experiência 1 tinha um erro de polarização elevado que foi reduzido na Experiência 3 através da regularização A Experiência 2 mostra que existe um erro de variância mínimo na Experiência 1
C. O modelo da Experiência 1 tinha um erro de polarização elevado e um erro de variância elevado que foram reduzidos na Experiência 3 através da regularização A Experiência 2 mostra que a polarização elevada não pode ser reduzida aumentando as camadas e os neurónios do modelo
D. O modelo da Experiência 1 tinha um erro elevado de ruído aleatório que foi reduzido na Experiência 3 através da regularização A Experiência 2 mostra que o ruído aleatório não pode ser reduzido aumentando as camadas e os neurónios do modelo
Ver resposta
Resposta correta: C
Pergunta #5
Uma empresa pretende prever os preços de venda de casas com base nos dados históricos de vendas disponíveis. A variável-alvo no conjunto de dados da empresa é o preço de venda. As características incluem parâmetros como a dimensão do lote, as medidas da área habitável, as medidas da área não habitável, o número de quartos, o número de casas de banho, o ano de construção e o código postal. A empresa pretende utilizar a regressão linear multivariada para prever os preços de venda das casas. Que passo deve dar um especialista em aprendizagem automática para remover características que são irrelevantes?
A. Trace um histograma das características e calcule o seu desvio padrão
B. Trace um histograma das características e calcule o seu desvio padrão
C. Construir um mapa de calor que mostre a correlação do conjunto de dados com ele próprio
D. Efetuar uma verificação da correlação de todas as características com a variável-alvo
Ver resposta
Resposta correta: D
Pergunta #6
Uma empresa pretende classificar o comportamento dos utilizadores como fraudulento ou normal. Com base em pesquisas internas, um especialista em aprendizado de máquina gostaria de criar um classificador binário com base em dois recursos: idade da conta e mês da transação. A distribuição de classes para essas características é ilustrada na figura fornecida. Com base nessas informações, qual modelo teria a MAIOR recuperação em relação à classe fraudulenta?
A. Árvore de decisão
B. Máquina de vectores de apoio linear (SVM)
C. Classificador Bayesiano ingénuo
D. Perceptron simples com função de ativação sigmoidal
Ver resposta
Resposta correta: C
Pergunta #7
Uma empresa de fabrico utiliza modelos de aprendizagem automática (ML) para detetar problemas de qualidade. Os modelos utilizam imagens que são tiradas do produto da empresa no final de cada etapa de produção. A empresa tem milhares de máquinas no local de produção que geram, em média, uma imagem por segundo. A empresa efectuou um piloto bem sucedido com uma única máquina de fabrico. Para o piloto, os especialistas em ML utilizaram um PC industrial que executava o AWS IoT Greengrass com uma função AWS Lambda de longa duração que carregava as imagens para a Amazon
A. Configure uma conexão AWS Direct Connect de 10 Gbps entre o site de produção e a região da AWS mais próxima
B. Estender a função Lambda de longa duração que é executada no AWS IoT Greengrass para comprimir as imagens e carregar os ficheiros comprimidos para o Amazon S3
C. Use o dimensionamento automático para o SageMaker
D. Implementar a função Lambda e os modelos ML no núcleo do AWS IoT Greengrass que está a ser executado nos PCs industriais instalados em cada máquina
Ver resposta
Resposta correta: D
Pergunta #8
Um especialista em aprendizagem automática criou um modelo de aprendizagem profunda de classificação de imagens. No entanto, o Especialista deparou-se com um problema de sobreajuste em que as precisões de treino e teste eram de 99% e 75%r, respetivamente. Como é que o especialista deve resolver este problema e qual é a razão por detrás dele?
A. A taxa de aprendizagem deve ser aumentada porque o processo de otimização ficou preso num mínimo local
B. A taxa de desistência na camada de achatamento deve ser aumentada porque o modelo não é suficientemente generalizado
C. A dimensionalidade da camada densa junto à camada achatada deve ser aumentada porque o modelo não é suficientemente complexo
D. O número de épocas deve ser aumentado porque o processo de otimização foi terminado antes de atingir o mínimo global
Ver resposta
Resposta correta: D
Pergunta #9
Uma empresa de retalho está a vender produtos através de um mercado online global. A empresa pretende utilizar a aprendizagem automática (ML) para analisar o feedback dos clientes e identificar áreas específicas de melhoria. Um programador criou uma ferramenta que recolhe as opiniões dos clientes do mercado online e armazena-as num bucket do Amazon S3. Este processo produz um conjunto de dados de 40 avaliações. Um cientista de dados que está a construir os modelos de ML deve identificar fontes adicionais de dados para aumentar o tamanho do conjunto de dados
A. Mensagens de correio eletrónico trocadas entre clientes e agentes do serviço de apoio ao cliente da empresa
B. Publicações nas redes sociais que contenham o nome da empresa ou dos seus produtos
C. Uma coleção de artigos de notícias disponível ao público
D. Uma coleção de opiniões de clientes disponível ao público
E. Valores das receitas das vendas de produtos da empresa
F. Manuais de instruções dos produtos da empresa
Ver resposta
Resposta correta: BDF
Pergunta #10
Um cientista de dados precisa criar uma solução de ingestão e análise sem servidor para dados de streaming de alta velocidade e em tempo real. O processo de ingestão deve armazenar em buffer e converter os registros de entrada de JSON para um formato colunar otimizado para consulta sem perda de dados. O armazenamento de dados de saída deve estar altamente disponível, e os analistas devem ser capazes de executar consultas SQL nos dados e conectar-se a painéis de business intelligence existentes. Que solução o cientista de dados deve criar para satisfazer os requisitos?
A. Crie um esquema no Catálogo de dados do AWS Glue da forma de dados de entrada
B. Utilizar um fluxo de entrega Amazon Kinesis Data Firehose para transmitir os dados e transformá-los no formato Apache Parquet ou ORC utilizando o AWS Glue Data Catalog antes de os entregar no Amazon S3
C. Escreva cada registo JSON numa localização de preparação no Amazon S3
D. Escreva cada registo JSON numa localização de preparação no Amazon S3
E. Fazer com que os analistas consultem e executem dashboards a partir da base de dados RDS
F. Utilizar o Amazon Kinesis Data Analytics para ingerir os dados de fluxo contínuo e realizar consultas SQL em tempo real para converter os registos em Apache Parquet antes de os entregar no Amazon S3
Ver resposta
Resposta correta: C
Pergunta #11
Um cientista de dados está a desenvolver um classificador binário para prever se um doente tem uma determinada doença com base numa série de resultados de testes. O cientista de dados tem dados sobre 400 doentes seleccionados aleatoriamente da população. A doença é observada em 3% da população. Que estratégia de validação cruzada deve o cientista de dados adotar?
A. Uma estratégia de validação cruzada k-fold com k=5
B. Uma estratégia de validação cruzada k-fold estratificada com k=5
C. Uma estratégia de validação cruzada k-fold com k=5 e 3 repetições
D. Uma divisão estratificada 80/20 entre formação e validação
Ver resposta
Resposta correta: B
Pergunta #12
Um especialista em aprendizagem automática de uma empresa sensível à segurança está a preparar um conjunto de dados para o treino de modelos. O conjunto de dados está armazenado no Amazon S3 e contém informações de identificação pessoal (Pll). O conjunto de dados: * Deve ser acessível apenas a partir de um VPC. * Não pode atravessar a Internet pública. Como esses requisitos podem ser atendidos?
A. Crie um ponto de extremidade de VPC e aplique uma política de acesso de balde que restrinja o acesso ao ponto de extremidade de VPC fornecido e à VPC
B. Crie um ponto de extremidade VPC e aplique uma política de acesso a buckets que permita o acesso a partir do ponto de extremidade VPC fornecido e de uma instância do Amazon EC2
C. Criar um ponto de extremidade VPC e utilizar Listas de Controlo de Acesso à Rede (NACLs) para permitir o tráfego apenas entre o ponto de extremidade VPC fornecido e uma instância do Amazon EC2
D. Crie um ponto de extremidade VPC e use grupos de segurança para restringir o acesso ao ponto de extremidade VPC fornecido e a uma instância do Amazon EC2
Ver resposta
Resposta correta: B
Pergunta #13
Durante o treino em mini-lotes de uma rede neural para um problema de classificação, um cientista de dados repara que a precisão do treino oscila Qual é a causa mais provável deste problema?
A. A distribuição das classes no conjunto de dados é desequilibrada
B. A baralhação do conjunto de dados está desactivada
C. O tamanho do lote é demasiado grande
D. A taxa de aprendizagem é muito elevada
Ver resposta
Resposta correta: C
Pergunta #14
Uma empresa pretende classificar o comportamento dos utilizadores como fraudulento ou normal. Com base em pesquisas internas, um especialista em aprendizado de máquina criará um classificador binário com base em dois recursos: idade da conta, denotada por x, e mês da transação, denotada por y. As distribuições de classe são ilustradas na figura fornecida. A classe positiva está representada a vermelho, enquanto a classe negativa está representada a preto. Qual o modelo que teria a MAIOR precisão?
A. Máquina de vectores de apoio linear (SVM)
B. Árvore de decisão
C. Máquina de vectores de apoio (SVM) com um núcleo de função de base radial
D. Perceptrão simples com uma função de ativação Tanh
Ver resposta
Resposta correta: C
Pergunta #15
Um especialista em aprendizagem automática tem de criar um processo para consultar um conjunto de dados no Amazon S3 utilizando o Amazon Athena. O conjunto de dados contém mais de 800.000 registos armazenados como ficheiros CSV de texto simples. Cada registo contém 200 colunas e tem cerca de 1,5 MB de tamanho. A maioria das consultas abrangerá apenas 5 a 10 colunas. Como é que o especialista em aprendizagem automática deve transformar o conjunto de dados para minimizar o tempo de execução da consulta?
A. Converta os registos para o formato Apache Parquet
B. Converter os registos para o formato JSON
C. Converta os registos para o formato GZIP CSV
D. Converter os registos para o formato XML
Ver resposta
Resposta correta: A
Pergunta #16
Uma cidade pretende monitorizar a qualidade do ar para fazer face às consequências da poluição atmosférica Um especialista em aprendizagem automática precisa de prever a qualidade do ar em partes por milhão de contaminantes para os próximos 2 dias na cidade Como se trata de um protótipo, apenas estão disponíveis dados diários do último ano Qual é o modelo com maior probabilidade de fornecer os melhores resultados no Amazon SageMaker?
A. Utilize o algoritmo k-Nearest-Neighbors (kNN) do Amazon SageMaker na série temporal única que consiste no ano completo de dados com um predictor_type de regressor
B. Use o Amazon SageMaker Random Cut Forest (RCF) na série temporal única que consiste no ano inteiro de dados
C. Utilize o algoritmo Linear Learner do Amazon SageMaker na série temporal única que consiste no ano completo de dados com um predictor_type de regressor
D. Use o algoritmo Linear Learner do Amazon SageMaker na série temporal única que consiste no ano inteiro de dados com um predictor_type de classificador
Ver resposta
Resposta correta: A
Pergunta #17
Uma empresa de jogos lançou um jogo online em que as pessoas podem começar a jogar gratuitamente, mas têm de pagar se optarem por utilizar determinadas funcionalidades. A empresa precisa de construir um sistema automatizado para prever se um novo utilizador se tornará ou não um utilizador pago no prazo de 1 ano. A empresa reuniu um conjunto de dados rotulados de 1 milhão de utilizadores. O conjunto de dados de treino é composto por 1 000 amostras positivas (de utilizadores que acabaram por pagar no prazo de 1 ano) e 999 000 amostras negativas (de utilizadores que não utilizaram quaisquer funcionalidades pagas). E
A. Adicione mais árvores profundas à floresta aleatória para permitir que o modelo aprenda mais características
B. Incluir uma cópia das amostras do conjunto de dados de teste no conjunto de dados de treino
C. Gerar mais amostras positivas duplicando as amostras positivas e adicionando uma pequena quantidade de ruído aos dados duplicados
D. Alterar a função de custo de modo a que os falsos negativos tenham um impacto maior no valor do custo do que os falsos positivos
E. Alterar a função de custo de modo a que os falsos positivos tenham um impacto maior no valor do custo do que os falsos negativos
Ver resposta
Resposta correta: CD
Pergunta #18
Um especialista em aprendizagem automática recebe um projeto TensorFlow utilizando o Amazon SageMaker para formação e precisa de continuar a trabalhar durante um período prolongado sem acesso Wi-Fi. Que abordagem deve o Especialista utilizar para continuar a trabalhar?
A. Instalar Python 3 e boto3 no portátil e continuar o desenvolvimento do código utilizando esse ambiente
B. Descarregar o contentor TensorFlow Docker utilizado no Amazon SageMaker do GitHub para o seu ambiente local e utilizar o Amazon SageMaker Python SDK para testar o código
C. Descarregue o TensorFlow de tensorflow
D. Transferir o bloco de notas do SageMaker para o ambiente local, instalar o Jupyter Notebooks no portátil e continuar o desenvolvimento num bloco de notas local
Ver resposta
Resposta correta: B
Pergunta #19
Um Especialista em Aprendizagem Automática está a criar uma nova aplicação de processamento de linguagem natural que processa um conjunto de dados composto por 1 milhão de frases. O objetivo é executar o Word2Vec para gerar embeddings das frases e permitir diferentes tipos de previsões
A. Efetuar a etiquetagem de parte do discurso e manter apenas o verbo de ação e os substantivos
B. Normalizar todas as palavras, tornando a frase em minúsculas
C. Remover palavras de paragem utilizando um dicionário de palavras de paragem em inglês
D. Corrija a tipografia de "quck" para "quick"
E. Codificar todas as palavras da frase
F. Tokenizar a frase em palavras
Ver resposta
Resposta correta: D
Pergunta #20
Um especialista em aprendizagem automática está a decidir entre construir um modelo Bayesiano ingénuo ou uma rede Bayesiana completa para um problema de classificação. O especialista calcula os coeficientes de correlação de Pearson entre cada caraterística e verifica que os seus valores absolutos variam entre 0,1 e 0,95
A. Um modelo Bayesiano ingénuo, uma vez que as características são todas condicionalmente independentes
B. Uma rede Bayesiana completa, uma vez que as características são todas condicionalmente independentes
C. Um modelo Bayesiano ingénuo, uma vez que algumas das características são estatisticamente dependentes
D. Uma rede Bayesiana completa, uma vez que algumas das características são estatisticamente dependentes
Ver resposta
Resposta correta: C
Pergunta #21
Uma empresa pretende melhorar as auditorias aos seus sistemas de aprendizagem automática (ML). O sistema de auditoria deve ser capaz de efetuar uma análise de metadados sobre as funcionalidades que os modelos de ML utilizam. A solução de auditoria tem de gerar um relatório que analise os metadados. A solução também deve ser capaz de definir a sensibilidade dos dados e a autoria das características. Que solução satisfará estes requisitos com o MENOR esforço de desenvolvimento? A solução que satisfará os requisitos com o menor esforço de desenvolvimento é utilizar o Amazon SageM
A. Utilizar o Amazon SageMaker Feature Store para selecionar as características
B. tilize o Amazon SageMaker Feature Store para definir grupos de características para as características actuais que os modelos ML utilizam
C. Utilizar o Amazon SageMaker Features Store para aplicar algoritmos personalizados para analisar os metadados ao nível das características que a empresa necessita
D. Utilize o Amazon SageMaker Feature Store para definir grupos de características para as características actuais que os modelos ML utilizam
Ver resposta
Resposta correta: D
Pergunta #22
Ao submeter tarefas de formação do Amazon SageMaker utilizando um dos algoritmos incorporados, que parâmetros comuns DEVEM ser especificados? (Escolha três.)
A. O canal de treino que identifica a localização dos dados de treino num balde do Amazon S3
B. O canal de validação que identifica a localização dos dados de validação num bucket do Amazon S3
C. A função IAM que o Amazon SageMaker pode assumir para executar tarefas em nome dos utilizadores
D. Hiperparâmetros numa matriz JSON, conforme documentado para o algoritmo utilizado
E. A classe da instância do Amazon EC2 que especifica se o treinamento será executado usando CPU ou GPU
F. O caminho de saída que especifica onde o modelo treinado persistirá num bucket do Amazon S3
Ver resposta
Resposta correta: AEF
Pergunta #23
Um cientista de dados precisa criar uma solução de ingestão e análise sem servidor para dados de streaming de alta velocidade e em tempo real. O processo de ingestão deve armazenar em buffer e converter os registros de entrada de JSON em um formato colunar otimizado para consulta sem perda de dados. O armazenamento de dados de saída deve ser altamente disponível, e os analistas devem ser capazes de executar consultas SQL nos dados e conectar-se a painéis de business intelligence existentes
A. Crie um esquema no AWS Glue Data Catalog do formato de dados de entrada
B. Escreva cada registo JSON numa localização de preparação no Amazon S3
C. Escreva cada registo JSON numa localização de preparação no Amazon S3
D. Utilizar o Amazon Kinesis Data Analytics para ingerir os dados de fluxo contínuo e realizar consultas SQL em tempo real para converter os registos em Apache Parquet antes de os entregar no Amazon S3
Ver resposta
Resposta correta: A
Pergunta #24
Um especialista em aprendizagem automática armazena dados de sensores de solo IoT na tabela Amazon DynamoDB e armazena dados de eventos meteorológicos como ficheiros JSON no Amazon S3. O conjunto de dados no DynamoDB tem 10 GB de tamanho e o conjunto de dados no Amazon S3 tem 5 GB de tamanho. O especialista deseja treinar um modelo nesses dados para ajudar a prever os níveis de umidade do solo em função de eventos climáticos usando o Amazon SageMaker. Qual solução realizará a transformação necessária para treinar o modelo do Amazon SageMaker com a MENOR quantidade de despesas administrativas?
A. Inicie um cluster do Amazon EMR
B. Rastrear os dados usando os rastreadores do AWS Glue
C. Active o Amazon DynamoDB Streams na tabela de sensores
D. Rastrear os dados usando os rastreadores do AWS Glue
Ver resposta
Resposta correta: C
Pergunta #25
Um Especialista em Aprendizagem Automática inicia um trabalho de afinação de hiperparâmetros para um modelo de conjunto baseado em árvore utilizando o Amazon SageMaker com a Área sob a Curva ROC (AUC) como métrica objetiva Este fluxo de trabalho será eventualmente implementado num pipeline que volta a treinar e afina os hiperparâmetros todas as noites para modelar o click-through em dados que ficam obsoletos a cada 24 horas Com o objetivo de diminuir o tempo necessário para treinar estes modelos e, em última análise, diminuir os custos, o Especialista pretende reconfigurar a entrada h
A. Um histograma que mostra se a caraterística de entrada mais importante é Gaussiana
B. Um gráfico de dispersão com pontos coloridos por variável-alvo que utiliza a incorporação de vizinhos estocásticos distribuídos (I-SNE) para visualizar o grande número de variáveis de entrada numa dimensão mais fácil de ler
C. Um gráfico de dispersão que mostra o desempenho da métrica objetiva em cada iteração de treino
D. Um gráfico de dispersão que mostra a correlação entre a profundidade máxima da árvore e a métrica objetiva
Ver resposta
Resposta correta: B

Ver as respostas após o envio

Por favor, envie seu e-mail e WhatsApp para obter respostas às perguntas.

Observação: certifique-se de que seu ID de e-mail e Whatsapp sejam válidos para que você possa obter os resultados corretos do exame.

E-mail:
WhatsApp/número de telefone: