¿NO QUIERES PERDERTE NADA?

Consejos para aprobar el examen de certificación

Últimas noticias sobre exámenes e información sobre descuentos.

Curado y actualizado por nuestros expertos.

Sí, envíame el boletín.

2024 Preguntas de examen y pruebas prácticas actualizadas de MLS-C01, Aprendizaje automático certificado de AWS | SPOTO

Prepárese para el éxito en el examen MLS-C01 2024 con las pruebas de práctica y preguntas de examen actualizadas de SPOTO. La certificación AWS Certified Machine Learning-Specialty (MLS-C01) está diseñada para profesionales en funciones de desarrollo o ciencia de datos, y valida sus habilidades en la creación, capacitación, ajuste e implementación de modelos de aprendizaje automático en la nube de AWS. Domine las preguntas y respuestas del examen para demostrar su competencia en el uso de los servicios de AWS para aplicaciones de ML. Utilice las pruebas de práctica y los volcados de exámenes para una preparación exhaustiva y una evaluación de sus conocimientos. Acceda a materiales de examen y simuladores de examen gratuitos para mejorar su práctica y preparación para el examen. SPOTO proporciona una gama de recursos, incluidos ejemplos de preguntas y simuladores de examen, para ayudarle a destacar en el examen MLS-C01 y avanzar en su carrera en el dinámico campo del aprendizaje automático. Prepárate con confianza y logra tus objetivos de certificación con el apoyo de SPOTO.
Realizar otros exámenes en línea

Cuestionar #1
Un especialista en aprendizaje automático inicia un trabajo de ajuste de hiperparámetros para un modelo de conjunto basado en árboles utilizando AmazonSageMaker con el área bajo la curva ROC (AUC) como métrica objetivo. Este flujo de trabajo se implementará finalmente en una línea de producción que vuelve a entrenar y ajustar los hiperparámetros cada noche para modelar los clics en los datos que caducan cada 24 horas
A. Un histograma que muestra si la característica de entrada más importante es gaussianA
B. Un gráfico de dispersión con puntos coloreados por variable objetivo que utiliza t-Distributed Stochastic Neighbor Embedding (t-SNE) para visualizar el gran número de variables de entrada en una dimensión más fácil de leer
C. Gráfico de dispersión que muestra el rendimiento de la métrica objetivo en cada iteración de entrenamiento
D. Gráfico de dispersión que muestra la correlación entre la profundidad máxima del árbol y la métrica objetivA
Ver respuesta
Respuesta correcta: B
Cuestionar #2
Una empresa inmobiliaria lanza un nuevo producto que predice los precios de las casas nuevas. Los datos históricos de las propiedades y los precios se almacenan en formato .csv en un bucket de Amazon S3. Los datos tienen un encabezado, algunos campos categóricos y algunos valores perdidos. Los científicos de datos de la empresa han utilizado Python con una biblioteca común de código abierto para rellenar los valores perdidos con ceros. Los científicos de datos han eliminado todos los campos categóricos y han entrenado un modelo utilizando el algoritmo de regresión lineal de código abierto
A. Cree una función vinculada al servicio para Amazon Elastic Container Service (Amazon ECS) con acceso al bucket de S3
B. Cree una libreta de Amazon SageMaker con un nuevo rol de IAM asociado a la libretA
C. Cree un rol de IAM con acceso a Amazon S3, Amazon SageMaker y AWS LambdA
D. Cree una función de IAM para Amazon SageMaker con acceso al bucket de S3
Ver respuesta
Respuesta correcta: A
Cuestionar #3
Un científico de datos está entrenando un modelo de clasificación de texto mediante el algoritmo BlazingText integrado en Amazon SageMaker. Hay 5 clases en el conjunto de datos, con 300 muestras para la categoría A, 292 muestras para la categoría B, 240 muestras para la categoría C, 258 muestras para la categoría D y 310 muestras para la categoría E. El científico de datos mezcla los datos y divide el 10% para las pruebas. Tras entrenar el modelo, el científico de datos genera matrices de confusión para los conjuntos de entrenamiento y prueba
A. Las clases C y D son demasiado similares
B. El conjunto de datos es demasiado pequeño para la validación cruzadA
C. La distribución de los datos es asimétricA
D. El modelo está sobreajustado para las clases B y E
Ver respuesta
Respuesta correcta: B
Cuestionar #4
Un Especialista en Aprendizaje Automático descubre las siguientes estadísticas mientras experimenta con un modelo. ¿Qué puede deducir el especialista de los experimentos?
A. El modelo del Experimento 1 tenía un error de varianza alto que se redujo en el Experimento 3 mediante regularización El Experimento 2 muestra que hay un error de sesgo mínimo en el Experimento 1
B. El modelo en el Experimento 1 tenía un alto error de sesgo que se redujo en el Experimento 3 mediante regularización El Experimento 2 muestra que hay un error de varianza mínimo en el Experimento 1
C. El modelo en el Experimento 1 tenía un error de sesgo alto y un error de varianza alto que se redujeron en el Experimento 3 mediante regularización El Experimento 2 muestra que el sesgo alto no puede reducirse aumentando las capas y las neuronas en el modelo
D. El modelo en el Experimento 1 tenía un alto error de ruido aleatorio que se redujo en Expenment 3 por regularización Expenment 2 muestra que el ruido aleatorio no se puede reducir mediante el aumento de capas y neuronas en el modelo
Ver respuesta
Respuesta correcta: C
Cuestionar #5
Una empresa quiere predecir los precios de venta de las casas basándose en los datos históricos de ventas disponibles. La variable objetivo del conjunto de datos de la empresa es el precio de venta. Las características incluyen parámetros como el tamaño del solar, las medidas de la superficie habitable, las medidas de la superficie no habitable, el número de dormitorios, el número de baños, el año de construcción y el código postal. La empresa desea utilizar la regresión lineal multivariable para predecir los precios de venta de las casas
A. Trace un histograma de las características y calcule su desviación estándar
B. Trace un histograma de las características y calcule su desviación estándar
C. Construir un mapa de calor que muestre la correlación del conjunto de datos entre sí
D. Ejecute una comprobación de correlación de todas las características con la variable objetivo
Ver respuesta
Respuesta correcta: D
Cuestionar #6
Una empresa quiere clasificar el comportamiento de los usuarios como fraudulento o normal. Basándose en una investigación interna, un especialista en aprendizaje automático quiere crear un clasificador binario basado en dos características: antigüedad de la cuenta y mes de la transacción. La distribución de clases de estas características se ilustra en la figura siguiente. Según esta información, ¿qué modelo tendría la MAYOR recuperación con respecto a la clase fraudulenta?
A. Árbol de decisión
B. Máquina lineal de vectores soporte (SVM)
C. Clasificador bayesiano ingenuo
D. Perceptrón simple con función de activación sigmoidal
Ver respuesta
Respuesta correcta: C
Cuestionar #7
Una empresa de fabricación utiliza modelos de aprendizaje automático para detectar problemas de calidad. Los modelos utilizan imágenes tomadas de los productos de la empresa al final de cada fase de producción. La empresa cuenta con miles de máquinas en el centro de producción que generan una imagen por segundo de media. Para el piloto, los especialistas en ML utilizaron un PC industrial que ejecutaba AWS IoT Greengrass con una función AWS Lambda de larga ejecución que cargaba las imágenes en Amazon
A. Configure una conexión AWS Direct Connect de 10 Gbps entre el sitio de producción y la región de AWS más cercanA
B. Ampliar la función de Lambda de larga duración que se ejecuta en AWS IoT Greengrass para comprimir las imágenes y cargar los archivos comprimidos en Amazon S3
C. Utilice el escalado automático para SageMaker
D. Implemente la función Lambda y los modelos ML en el núcleo de AWS IoT Greengrass que se ejecuta en los PC industriales instalados en cada máquinA
Ver respuesta
Respuesta correcta: D
Cuestionar #8
Un especialista en aprendizaje automático creó un modelo de aprendizaje profundo de clasificación de imágenes. Sin embargo, el especialista se encontró con un problema de sobreajuste en el que las precisiones de entrenamiento y prueba fueron del 99 % y el 75 % respectivamente. Cómo debería abordar el especialista este problema y cuál es la razón?
A. La tasa de aprendizaje debe aumentarse porque el proceso de optimización quedó atrapado en un mínimo local
B. La tasa de abandono en la capa plana debe aumentarse porque el modelo no está suficientemente generalizado
C. La dimensionalidad de la capa densa junto a la capa plana debe aumentarse porque el modelo no es lo suficientemente complejo
D. El número de épocas debe aumentarse porque el proceso de optimización finalizó antes de alcanzar el mínimo global
Ver respuesta
Respuesta correcta: D
Cuestionar #9
Una empresa minorista vende productos a través de un mercado global en línea. La empresa desea utilizar el aprendizaje automático (ML) para analizar las opiniones de los clientes e identificar áreas específicas de mejora. Un desarrollador ha creado una herramienta que recopila las opiniones de los clientes del mercado online y las almacena en un bucket de Amazon S3. Este proceso produce un conjunto de datos de 40 reseñas.Un científico de datos que construye los modelos de ML debe identificar fuentes de datos adicionales para aumentar el tamaño del conjunto de datos.¿Qué fuentes de datos debe identificar el científico de datos?
A. Correos electrónicos intercambiados por los clientes y los agentes del servicio de atención al cliente de la empresa
B. Publicaciones en redes sociales que contengan el nombre de la empresa o sus productos
C. Una colección de artículos de noticias a disposición del público
D. Una recopilación pública de opiniones de clientes
E. Cifras de ingresos por venta de productos de la empresa
F. Manuales de instrucciones de los productos de la empresa
Ver respuesta
Respuesta correcta: BDF
Cuestionar #10
Un científico de datos necesita crear una solución de ingesta y análisis sin servidor para datos de streaming de alta velocidad y en tiempo real. El proceso de ingestión debe almacenar en búfer y convertir los registros entrantes de JSON a un formato columnar optimizado para consultas sin pérdida de datos. El almacén de datos de salida debe tener una alta disponibilidad, y los analistas deben poder ejecutar consultas SQL con los datos y conectarse a los cuadros de mando de inteligencia empresarial existentes. ¿Qué solución debería crear el científico de datos para satisfacer los requisitos?
A. Cree un esquema en el catálogo de datos de AWS Glue del formulario de datos entrantes
B. Utilice una transmisión de entrega de Amazon Kinesis Data Firehose para transmitir los datos y transformarlos a formato Apache Parquet u ORC mediante el catálogo de datos de AWS Glue antes de entregarlos a Amazon S3
C. Escriba cada registro JSON en una ubicación de almacenamiento en Amazon S3
D. Escriba cada registro JSON en una ubicación de almacenamiento en Amazon S3
E. Hacer que los analistas consulten y ejecuten cuadros de mando desde la base de datos RDS
F. Utilice Amazon Kinesis Data Analytics para ingerir los datos de streaming y realizar consultas SQL en tiempo real para convertir los registros a Apache Parquet antes de entregarlos a Amazon S3
Ver respuesta
Respuesta correcta: C
Cuestionar #11
Un científico de datos está desarrollando un clasificador binario para predecir si un paciente padece una enfermedad determinada a partir de una serie de resultados de prueba. El científico dispone de datos de 400 pacientes seleccionados aleatoriamente de la población. ¿Qué estrategia de validación cruzada debe adoptar el científico de datos?
A. Una estrategia de validación cruzada k-fold con k=5
B. Una estrategia de validación cruzada k-fold estratificada con k=5
C. Una estrategia de validación cruzada k-fold con k=5 y 3 repeticiones
D. Un reparto estratificado 80/20 entre entrenamiento y validación
Ver respuesta
Respuesta correcta: B
Cuestionar #12
Un especialista en aprendizaje automático de una empresa sensible a la seguridad está preparando un conjunto de datos para el entrenamiento de modelos. El conjunto de datos se almacena en Amazon S3 y contiene información de identificación personal (IPI). El conjunto de datos: * Debe ser accesible únicamente desde una VPC. * No debe atravesar la Internet pública. ¿Cómo se pueden cumplir estos requisitos?
A. Cree un punto final de VPC y aplique una política de acceso a bucket que restrinja el acceso al punto final de VPC dado y a la VPC
B. Cree un punto final de VPC y aplique una política de acceso a buckets que permita el acceso desde el punto final de VPC dado y una instancia de Amazon EC2
C. Cree un punto final de VPC y utilice listas de control de acceso a la red (NACL) para permitir el tráfico únicamente entre el punto final de VPC en cuestión y una instancia de Amazon EC2
D. Cree un punto final de VPC y utilice grupos de seguridad para restringir el acceso al punto final de VPC dado y a una instancia de Amazon EC2
Ver respuesta
Respuesta correcta: B
Cuestionar #13
Durante el entrenamiento por mini lotes de una red neuronal para un problema de clasificación, un científico de datos observa que la precisión del entrenamiento oscila ¿Cuál es la causa MÁS probable de este problema?
A. La distribución de clases en el conjunto de datos está desequilibrada
B. Barajado de conjuntos de datos desactivado
C. El tamaño del lote es demasiado grande
D. La tasa de aprendizaje es muy alta
Ver respuesta
Respuesta correcta: C
Cuestionar #14
Una empresa quiere clasificar el comportamiento de los usuarios como fraudulento o normal. Basándose en una investigación interna, un especialista en aprendizaje automático creará un clasificador binario basado en dos características: la antigüedad de la cuenta, indicada por x, y el mes de la transacción, indicado por y. Las distribuciones de clases se ilustran en la figura. La clase positiva aparece en rojo, mientras que la clase negativa aparece en negro
A. Máquina lineal de vectores soporte (SVM)
B. Árbol de decisión
C. Máquina de vectores soporte (SVM) con un núcleo de función de base radial
D. Perceptrón simple con función de activación Tanh
Ver respuesta
Respuesta correcta: C
Cuestionar #15
Un especialista en aprendizaje automático debe crear un proceso para consultar un conjunto de datos en Amazon S3 mediante Amazon Athena. El conjunto de datos contiene más de 800 000 registros almacenados como archivos CSV de texto sin formato. Cada registro contiene 200 columnas y tiene un tamaño aproximado de 1,5 MB. La mayoría de las consultas abarcarán solo entre 5 y 10 columnas. ¿Cómo debe transformar el conjunto de datos el especialista en aprendizaje automático para minimizar el tiempo de ejecución de la consulta?
A. Convertir los registros al formato Apache Parquet
B. Convertir los registros a formato JSON
C. Convertir los registros al formato GZIP CSV
D. Convertir los registros a formato XML
Ver respuesta
Respuesta correcta: A
Cuestionar #16
Una ciudad quiere monitorizar la calidad del aire para hacer frente a las consecuencias de la contaminación atmosférica Un especialista en Machine Learning necesita pronosticar la calidad del aire en partes por millón de contaminantes para los próximos 2 días en la ciudad Como se trata de un prototipo, sólo se dispone de datos diarios del último año ¿Qué modelo es MÁS probable que proporcione los mejores resultados en Amazon SageMaker?
A. Utilice el algoritmo k-Nearest-Neighbors (kNN) de Amazon SageMaker en la serie temporal única consistente en el año completo de datos con un predictor_type de regresor
B. Utilizar el Random Cut Forest (RCF) de Amazon SageMaker en la serie temporal única compuesta por el año completo de datos
C. Utilice el algoritmo Linear Learner de Amazon SageMaker en la serie temporal única consistente en el año completo de datos con un predictor_type de regresor
D. Utilizar el algoritmo Linear Learner de Amazon SageMaker en la serie temporal única consistente en el año completo de datos con un predictor_type de clasificador
Ver respuesta
Respuesta correcta: A
Cuestionar #17
Una empresa de juegos ha lanzado un juego en línea en el que se puede empezar a jugar gratis, pero hay que pagar si se quieren utilizar determinadas funciones. La empresa necesita crear un sistema automatizado para predecir si un nuevo usuario se convertirá en usuario de pago en el plazo de un año. La empresa ha recopilado un conjunto de datos etiquetados de 1 millón de usuarios. El conjunto de datos de entrenamiento consta de 1.000 muestras positivas (de usuarios que acabaron pagando en el plazo de 1 año) y 999.000 muestras negativas (de usuarios que no utilizaron ninguna función de pago). E
A. Añadir más árboles profundos al bosque aleatorio para permitir que el modelo aprenda más características
B. Incluir una copia de las muestras del conjunto de datos de prueba en el conjunto de datos de entrenamiento
C. Generar más muestras positivas duplicando las muestras positivas y añadiendo una pequeña cantidad de ruido a los datos duplicados
D. Cambiar la función de costes de modo que los falsos negativos tengan un mayor impacto en el valor del coste que los falsos positivos
E. Modificar la función de coste de modo que los falsos positivos tengan un mayor impacto en el valor del coste que los falsos negativos
Ver respuesta
Respuesta correcta: CD
Cuestionar #18
A un especialista en aprendizaje automático se le asigna un proyecto de TensorFlow que utiliza Amazon SageMaker para la capacitación y necesita seguir trabajando durante un periodo prolongado sin acceso Wi-Fi. Qué método debe utilizar el especialista para seguir trabajando?
A. Instalar Python 3 y boto3 en su portátil y continuar el desarrollo del código utilizando ese entorno
B. Descargue el contenedor Docker de TensorFlow utilizado en Amazon SageMaker de GitHub a su entorno local y utilice el SDK de Python de Amazon SageMaker para probar el código
C. Descarga TensorFlow desde tensorflow
D. Descargar el cuaderno SageMaker a su entorno local, luego instalar Jupyter Notebooks en su portátil y continuar el desarrollo en un cuaderno local
Ver respuesta
Respuesta correcta: B
Cuestionar #19
Un especialista en aprendizaje automático está creando una nueva aplicación de procesamiento de lenguaje natural que procesa un conjunto de datos compuesto por 1 millón de frases El objetivo es ejecutar Word2Vec para generar incrustaciones de las frases y permitir diferentes tipos de predicciones Este es un ejemplo del conjunto de datos "The quck BROWN FOX jumps over the lazy dog " ¿Cuáles de las siguientes son las operaciones que el especialista necesita realizar para limpiar correctamente y preparar los datos de forma repetible? (Seleccione TRES)
A. Realice el etiquetado de parte de discurso y mantenga sólo el verbo de acción y los sustantivos
B. Normalizar todas las palabras poniendo la frase en minúsculas
C. Elimine las palabras vacías utilizando un diccionario de palabras vacías en inglés
D. Corregir la tipografía de "quck" por "quick"
E. Codificar con una sola palabra todas las palabras de la frase
F. Dividir la frase en palabras
Ver respuesta
Respuesta correcta: D
Cuestionar #20
Un especialista en aprendizaje automático está decidiendo entre construir un modelo bayesiano ingenuo o una red bayesiana completa para un problema de clasificación. El especialista calcula los coeficientes de correlación de Pearson entre cada característica y descubre que sus valores absolutos oscilan entre 0,1 y 0,95. ¿Qué modelo describe los datos subyacentes en esta situación?
A. Un modelo bayesiano ingenuo, ya que todas las características son condicionalmente independientes
B. Una red bayesiana completa, ya que todas las características son condicionalmente independientes
C. Un modelo bayesiano ingenuo, ya que algunas de las características son estadísticamente dependientes
D. Una red bayesiana completa, ya que algunas de las características son estadísticamente dependientes
Ver respuesta
Respuesta correcta: C
Cuestionar #21
Una empresa desea mejorar las auditorías de sus sistemas de aprendizaje automático (ML). El sistema de auditoría debe ser capaz de realizar análisis de metadatos sobre las características que utilizan los modelos ML. La solución de auditoría debe generar un informe que analice los metadatos. La solución también debe ser capaz de establecer la sensibilidad de los datos y la autoría de las características. ¿Qué solución cumplirá estos requisitos con el MENOR esfuerzo de desarrollo? La solución que cumplirá los requisitos con el menor esfuerzo de desarrollo es utilizar Amazon SageM
A. tilice el almacén de características de Amazon SageMaker para seleccionar las características
B. tilice el almacén de características de Amazon SageMaker para establecer grupos de características para las características actuales que utilizan los modelos de ML
C. tilice el almacén de características de Amazon SageMaker para aplicar algoritmos personalizados con el fin de analizar los metadatos a nivel de característica que necesita la empresA
D. tilice el almacén de características de Amazon SageMaker para establecer grupos de características para las características actuales que utilizan los modelos de ML
Ver respuesta
Respuesta correcta: D
Cuestionar #22
Al enviar trabajos de formación de Amazon SageMaker utilizando uno de los algoritmos incorporados, ¿qué parámetros comunes DEBEN especificarse? (Elija tres.)
A. El canal de entrenamiento que identifica la ubicación de los datos de entrenamiento en un bucket de Amazon S3
B. El canal de validación que identifica la ubicación de los datos de validación en un bucket de Amazon S3
C. El rol IAM que Amazon SageMaker puede asumir para realizar tareas en nombre de los usuarios
D. Hiperparámetros en una matriz JSON según lo documentado para el algoritmo utilizado
E. La clase de instancia de Amazon EC2 que especifica si el entrenamiento se ejecutará utilizando la CPU o la GPU
F. La ruta de salida que especifica en qué bucket de Amazon S3 persistirá el modelo entrenado
Ver respuesta
Respuesta correcta: AEF
Cuestionar #23
Un científico de datos debe crear una solución de ingesta y análisis sin servidor para datos de flujo en tiempo real a alta velocidad. El proceso de ingesta debe almacenar en búfer y convertir los registros entrantes de JSON a un formato columnar optimizado para consultas sin pérdida de datos. El almacén de datos de salida debe tener una alta disponibilidad, y los analistas deben poder ejecutar consultas SQL con los datos y conectarse a los paneles de inteligencia empresarial existentes
A. Cree un esquema en el catálogo de datos de AWS Glue del formato de los datos entrantes
B. Escriba cada registro JSON en una ubicación de almacenamiento en Amazon S3
C. Escriba cada registro JSON en una ubicación de almacenamiento en Amazon S3
D. Utilice Amazon Kinesis Data Analytics para ingerir los datos de streaming y realizar consultas SQL en tiempo real para convertir los registros a Apache Parquet antes de entregarlos a Amazon S3
Ver respuesta
Respuesta correcta: A
Cuestionar #24
Un especialista en aprendizaje automático almacena datos de sensores de suelo IoT en una tabla de Amazon DynamoDB y almacena datos de eventos meteorológicos como archivosJSON en Amazon S3. El conjunto de datos en DynamoDB tiene un tamaño de 10 GB y el conjunto de datos en Amazon S3 tiene un tamaño de 5 GB. El especialista desea entrenar un modelo en estos datos para ayudar a predecir los niveles de humedad del suelo en función de los eventos meteorológicos mediante Amazon SageMaker. ¿Qué solución realizará la transformación necesaria para entrenar el modelo de Amazon SageMaker con la MENOR cantidad de gastos administrativos?
A. Inicie un clúster de Amazon EMR
B. Rastrear los datos con rastreadores de AWS Glue
C. Habilite Amazon DynamoDB Streams en la tabla de sensores
D. Rastrear los datos con rastreadores de AWS Glue
Ver respuesta
Respuesta correcta: C
Cuestionar #25
Un especialista en aprendizaje automático inicia un trabajo de ajuste de hiperparámetros para un modelo de conjunto basado en árboles utilizando Amazon SageMaker con el área bajo la curva ROC (AUC) como métrica objetivo Este flujo de trabajo se implementará finalmente en una canalización que reentrena y ajusta los hiperparámetros cada noche para modelar los clics en los datos que caducan cada 24 horas Con el objetivo de reducir la cantidad de tiempo que se tarda en entrenar estos modelos y, en última instancia, reducir los costes, el especialista desea reconfigurar los hiperparámetros de entrada
A. Un histograma que muestra si la característica de entrada más importante es gaussianA
B. Un gráfico de dispersión con puntos coloreados por variable objetivo que utiliza (-Distributed Stochastic Neighbor Embedding (I-SNE) para visualizar el gran número de variables de entrada en una dimensión más fácil de leer
C. Un gráfico de dispersión que muestra el rendimiento de la métrica objetivo en cada iteración de entrenamiento
D. Gráfico de dispersión que muestra la correlación entre la profundidad máxima del árbol y la métrica objetivA
Ver respuesta
Respuesta correcta: B

Ver respuestas después del envío

Envíe su correo electrónico y WhatsApp para obtener las respuestas a sus preguntas.

Nota: asegúrese de que su ID de correo electrónico y Whatsapp sean válidos para que pueda obtener los resultados correctos del examen.

Correo electrónico:
WhatsApp/número de teléfono: