아무것도 놓치고 싶지 않으신가요?

인증 시험 합격 팁

최신 시험 소식 및 할인 정보

전문가가 선별하고 최신 정보를 제공합니다.

예, 뉴스레터를 보내주세요

업데이트 된 MLS-C01 연습 문제로 쉽게 AWS 시험에 합격하십시오

성공을 위한 종합적인 시험 문제와 답변 모음을 통해 SPOTO AWS MLS-C01 시험에 효과적으로 대비하세요. 시험 문제는 AWS Certified Machine Learning - Specialty 자격증에 필수적인 핵심 주제를 다루고 있어 시험 당일에 철저한 준비와 자신감을 보장합니다. AWS 플랫폼에서 머신러닝 모델을 구축, 교육, 최적화 및 배포하는 것에 대한 이해를 높일 수 있도록 설계된 귀중한 시험 리소스와 학습 자료를 이용하세요. 클라우드 기반 머신 러닝 이니셔티브 구현에 대한 전문성을 입증하여 성공적으로 합격하는 데 필요한 도구와 지식을 제공하는 데 중점을 두고 있습니다.

다른 온라인 시험에 응시하세요

질문 #1
자동차 엔진 제조업체는 자동차가 주행할 때 데이터를 수집합니다. 수집되는 데이터에는 타임스탬프, 엔진 온도, 분당 회전수(RPM) 및 기타 센서 판독값이 포함됩니다. 이 회사는 엔진에 문제가 발생할 시점을 예측하여 운전자에게 미리 알려 엔진 정비를 받을 수 있도록 하려고 합니다. 엔진 데이터는 학습을 위해 데이터 레이크에 로드됩니다. 프로덕션에 배포할 수 있는 가장 적합한 예측 모델은 무엇인가요?
A. 시간에 따른 레이블을 추가하여 향후 몇 시에 어떤 엔진 결함이 발생하는지 표시하여 이를 지도 학습 문제로 전환합니다
B. 데이터에는 비지도 학습 알고리즘이 필요합니다
C. 시간에 따른 레이블을 추가하여 향후 몇 시점에 어떤 엔진 결함이 발생하는지 표시하여 이를 지도 학습 문제로 전환합니다
D. 데이터는 이미 시계열로 공식화되어 있습니다
답변 보기
정답: A

View The Updated MLS C01 Exam Questions

SPOTO Provides 100% Real MLS C01 Exam Questions for You to Pass Your MLS C01 Exam!

질문 #2
데이터 과학자는 회사의 이커머스 플랫폼에서 사기성 사용자 계정을 식별해야 합니다. 회사는 새로 생성된 계정이 이전에 알려진 사기성 사용자와 연관되어 있는지 확인할 수 있는 기능을 원합니다. 데이터 과학자는 수집 중에 회사의 애플리케이션 로그를 정리하기 위해 AWS Glue를 사용하고 있습니다. 데이터 과학자가 사기성 계정을 식별할 수 있는 전략은 무엇인가요?
A. 기본 제공 FindDuplicates Amazon Athena 쿼리를 실행합니다
B. AWS Glue에서 FindMatches 머신 러닝 트랜스폼을 생성합니다
C. 스 데이터에서 중복 계정을 추론하기 위해 AWS Glue 크롤러를 생성합니다
D. WS Glue 데이터 카탈로그에서 중복 계정을 검색합니다
답변 보기
정답: B
질문 #3
한 소매업체가 머신러닝을 사용해 신제품을 분류하려고 합니다. 현재 판매 중인 제품의 라벨이 지정된 데이터 세트가 데이터 과학 팀에 제공되었습니다. 이 데이터 세트에는 1,200개의 제품이 포함되어 있습니다. 레이블이 지정된 데이터 세트에는 제목 크기, 무게, 가격 등 각 제품에 대한 15개의 특징이 있습니다. 각 제품은 책, 게임, 전자 제품, 영화 등 6가지 범주 중 하나에 속하는 것으로 레이블이 지정되어 있습니다. 제공된 데이터 집합을 사용하여 새로운 제품을 분류하는 훈련에 어떤 모델을 사용해야 하나요?
A. 목표 파라미터가 multi:softmax로 설정된 AnXGBoost 모델
B. 지막 레이어에 소프트맥스 활성화 기능이 있는 심층 컨볼루션 신경망(CNN)
C. 리 수가 제품 카테고리 수와 동일하게 설정된 회귀 포리스트(C
D. 순환 신경망(RNN) 기반 딥 AR 예측 모델
답변 보기
정답: A
질문 #4
데이터 과학자는 데이터 탐색 및 분석을 수행하기 위해 Amazon SageMaker 노트북 인스턴스를 사용합니다. 이를 위해서는 Amazon SageMaker에서 기본적으로 제공되지 않는 특정 Python 패키지를 노트북 인스턴스에 설치해야 하는데, 머신 러닝 전문가가 데이터 과학자가 사용할 수 있도록 노트북 인스턴스에서 필요한 패키지를 자동으로 사용할 수 있도록 하려면 어떻게 해야 하나요?
A. 기본 Amazon EC2 인스턴스에 AWS 시스템 관리자 에이전트를 설치하고 시스템 관리자 자동화를 사용하여 패키지 설치 명령을 실행합니다
B. 실행할 패키지 설치 명령이 포함된 셀이 있는 Jupyter 노트북 파일(
C. 트북의 기본 커널에 필요한 콘다 패키지를 적용하려면 Jupyter 노트북 콘솔에서 콘다 패키지 관리자를 사용하세요
D. 키지 설치 명령으로 Amazon SageMaker 수명 주기 구성을 만들고 노트북 인스턴스에 수명 주기 구성을 할당합니다
답변 보기
정답: D
질문 #5
과일 가공 회사에서 일하는 한 머신러닝 전문가는 사과를 세 가지 유형으로 분류하는 시스템을 구축해야 합니다. 이 전문가는 각 사과 유형에 대한 150개의 이미지가 포함된 데이터 세트를 수집하고 이 데이터 세트로 ImageNet에서 사전 학습된 신경망에 전이 학습을 적용했습니다.이 회사는 모델을 사용하기 위해 최소 85%의 정확도를 요구합니다.철저한 그리드 검색 후 최적의 하이퍼파라미터는 다음과 같이 산출되었습니다.-학습 세트에서 68%의 정확도-67
A. 이미지를 회색조로 변환하고 모델을 다시 훈련합니다
B. 고유 항목의 수를 10개에서 2개로 줄이고 모델을 구축한 후 반복합니다
C. 각 항목에 다른 색상의 라벨을 붙이고 이미지를 다시 가져와서 모델을 만듭니다
D. 전 및 번역과 같은 이미지 변형을 사용하여 각 항목에 대한 학습 데이터를 보강하고 모델을 구축한 후 반복합니다
답변 보기
정답: B
질문 #6
머신 러닝 전문가가 소규모 데이터 샘플을 사용하여 회사를 위한 개념 증명을 완료했으며 이제 Amazon SageMaker를 사용하여 AWS에서 엔드투엔드 솔루션을 구현할 준비가 되었습니다. 과거 학습 데이터는 Amazon RDS에 저장되어 있는데, 이 전문가가 해당 데이터를 사용하여 모델을 학습하려면 어떤 접근 방식을 사용해야 하나요?
A. 노트북 내에서 SQL 데이터베이스에 직접 연결하고 데이터를 가져옵니다
B. AWS 데이터 파이프라인을 사용해 Microsoft SQL Server에서 Amazon S3로 데이터를 푸시하고 노트북 내에서 S3 위치를 제공합니다
C. 이터를 Amazon DynamoDB로 옮기고 노트북 내에서 DynamoDB에 대한 연결을 설정해 데이터를 가져옵니다
D. WS DMS를 사용해 데이터를 Amazon ElastiCache로 옮기고 노트북 내에서 연결을 설정해 데이터를 가져와 빠르게 액세스할 수 있도록 합니다
답변 보기
정답: B
질문 #7
한 회사에서 머신 러닝(ML)을 기반으로 예측 유지 관리 모델을 구축하고 있습니다. 데이터는 완전히 비공개인 Amazon S3 버킷에 저장되며, 이 버킷은 AWS 키 관리 서비스(AWS KMS) CMK를 통해 미사용 시 암호화됩니다. ML 전문가는 Amazon SageMaker 노트북의 코드에서 트리거되는 Amazon SageMaker 프로세싱 작업을 사용하여 데이터 전처리를 실행해야 합니다. 이 작업은 Amazon S3에서 데이터를 읽고, 처리한 다음 동일한 S3 버킷에 다시 업로드해야 합니다. 전처리 코드는 컨테이너 이미지에 저장됩니다
A. 아마존 세이지메이커 처리 작업을 생성할 수 있는 권한, 관련 S3 버킷에 대한 S3 읽기 및 쓰기 액세스 권한, 적절한 KMS 및 ECR 권한이 있는 IAM 역할을 만듭니다
B. 아마존 세이지메이커 처리 작업을 생성할 수 있는 권한이 있는 IAM 역할을 만듭니다
C. 아마존 세이지메이커 처리 작업을 생성하고 아마존 ECR에 액세스할 수 있는 권한이 있는 IAM 역할을 만듭니다
D. 아마존 세이지메이커 처리 작업을 만들 수 있는 권한이 있는 IAM 역할을 만듭니다
답변 보기
정답: D
질문 #8
한 머신러닝 전문가가 대기업과 협력하여 자사 제품 내에서 머신러닝을 활용하고 있습니다. 이 회사는 향후 6개월 이내에 이탈할 고객과 그렇지 않을 고객을 기준으로 고객을 카테고리로 분류하려고 합니다. 이 회사는 전문가가 사용할 수 있는 데이터에 레이블을 지정했는데, 이 작업을 수행하기 위해 어떤 머신 러닝 모델 유형을 사용해야 하나요?
A. 선형 회귀
B. 류
C. 러스터링
D. 화 학습
답변 보기
정답: B
질문 #9
머신 러닝(ML) 전문가가 모델 모니터링이 구성된 프로덕션 Amazon SageMaker 엔드포인트를 관리하고 있습니다. Amazon SageMaker 모델 모니터가 SageMaker 엔드포인트에서 위반을 감지하면 ML 전문가가 최신 데이터 세트로 모델을 재학습합니다. 이 데이터 세트는 현재 프로덕션 트래픽을 통계적으로 대표합니다. ML 전문가는 새 SageMaker 모델을 배포하고 첫 번째 모니터링 작업을 실행한 후에도 SageMaker 엔드포인트에 여전히 위반 사항이 있음을 발견합니다
A. 모니터링 작업을 수동으로 트리거하여 세이지메이커 엔드포인트 트래픽 샘플을 재평가합니다
B. 새 학습 세트에서 모델 모니터 기준선 작업을 다시 실행합니다
C. 드포인트를 삭제하고 원래 구성으로 다시 생성합니다
D. 원래 학습 세트와 새 학습 세트의 조합을 사용하여 모델을 다시 학습시킵니다
답변 보기
정답: B
질문 #10
한 회사에서 매장 진열대에 진열된 상품 상단의 카메라 이미지를 사용하여 어떤 상품이 제거되고 어떤 상품이 남아 있는지 파악합니다. 몇 시간의 데이터 라벨링 작업 끝에 이 회사는 10개 품목에 대해 총 1,000개의 수작업 라벨이 부착된 이미지를 확보했습니다. 훈련 결과가 좋지 않았습니다. 어떤 머신 러닝 접근 방식이 회사의 장기적인 요구를 충족시킬까요?
A. =5를 사용한 k배수 교차 검증 전략
B. 계층화된 k배수 교차 검증 전략(k=5)
C. =5, 3번 반복하는 C
D. 육과 검증을 80/20으로 계층화한 분할
답변 보기
정답: D
질문 #11
머신러닝 전문가가 고양이를 식별하기 위한 지도 이미지 인식 모델을 구축해야 합니다. ML 전문가는 몇 가지 테스트를 수행하고 신경망 기반 이미지 분류기에 대해 다음 결과를 기록합니다.사용 가능한 총 이미지 수 = 1,000테스트 세트 이미지 = 100(일정한 테스트 세트)ML 전문가는 잘못 분류된 이미지의 75% 이상에서 고양이가 주인이 거꾸로 들고 있는 것을 발견했습니다.ML 전문가는 이 특정 테스트 오류를 개선하기 위해 어떤 기술을 사용할 수 있습니까?
A. 학습 이미지에 회전의 변화를 추가하여 학습 데이터를 늘립니다
B. 모델 학습을 위한 에포크 수 늘리기
C. 신경망의 레이어 수를 늘립니다
D. 두 번째에서 마지막 레이어의 드롭아웃 비율을 높입니다
답변 보기
정답: A
질문 #12
기본 제공 알고리즘 중 하나를 사용하여 Amazon SageMaker 교육 작업을 제출할 때 반드시 지정해야 하는 공통 매개 변수는 무엇인가요? (세 가지를 선택하세요.)
A. 진화
B. 핫 인코딩
C. 큰화
D. 규화 변환
답변 보기
정답: AEF
질문 #13
한 머신러닝 전문가가 회사의 매출 향상을 위한 시스템을 설계하고 있습니다. 회사의 목표는 사용자의 행동과 제품 선호도에 대해 회사가 보유한 방대한 양의 정보를 사용하여 사용자가 다른 사용자와의 유사성을 기반으로 어떤 제품을 좋아할지 예측하는 것인데, 이 목표를 달성하기 위해 전문가가 해야 할 일은 무엇인가요?
A. mazon EMR에서 Apache Spark ML로 콘텐츠 기반 필터링 추천 엔진 구축하기
B. mazon EMR에서 Apache Spark ML로 협업 필터링 추천 엔진을 구축하세요
C. mazon EMR에서 Apache Spark ML로 모델 기반 필터링 추천 엔진 구축하기
D. mazon EMR에서 Apache Spark ML로 결합 필터링 추천 엔진 구축하기
답변 보기
정답: B
질문 #14
한 회사에서 대량의 비정형 종이 영수증을 이미지로 변환하고 있습니다. 이 회사는 날짜, 위치, 메모와 같은 관련 엔터티와 영수증 번호와 같은 일부 사용자 지정 엔터티를 찾기 위해 자연어 처리(NLP) 기반의 모델을 만들고자 하며, 광학 문자 인식(OCR)을 사용하여 데이터 라벨링을 위한 텍스트를 추출하고 있습니다. 하지만 문서 구조와 형식이 서로 다르고, 각 문서에 대한 수동 워크플로우를 설정하는 데 어려움을 겪고 있습니다
A. Amazon Textract를 사용하여 영수증 이미지에서 텍스트를 추출합니다
B. AWS 마켓플레이스의 딥러닝 OCR 모델을 사용하여 영수증 이미지에서 텍스트를 추출합니다
C. Amazon Textract를 사용하여 영수증 이미지에서 텍스트를 추출합니다
D. AWS 마켓플레이스의 딥러닝 OCR 모델을 사용하여 영수증 이미지에서 텍스트를 추출합니다
답변 보기
정답: C
질문 #15
머신 러닝 전문가가 1,000개의 레코드와 50개의 피처가 있는 데이터 세트에 선형 최소제곱 회귀 모델을 적용하고 있습니다. 학습 전에 ML 전문가는 두 피처가 완벽하게 선형적으로 종속되어 있음을 발견합니다. 선형 최소제곱 회귀 모델에서 이것이 왜 문제가 될 수 있을까요?
A. 훈련 중 역전파 알고리즘이 실패할 수 있습니다
B. 최적화 중에 단일 행렬을 생성하여 고유 한 솔루션을 정의하지 못할 수 있습니다
C. 적화 중에 손실 함수를 수정하여 훈련 중에 실패 할 수 있습니다
D. 데이터 내에 비선형 종속성을 도입하여 모델의 선형 가정을 무효화할 수 있습니다
답변 보기
정답: C
질문 #16
한 이커머스 회사가 웹 애플리케이션에 새로운 클라우드 기반 상품 추천 기능을 출시하려고 합니다. 데이터 현지화 규정으로 인해 민감한 데이터는 온프레미스 데이터 센터를 벗어나서는 안 되며, 상품 추천 모델은 민감하지 않은 데이터만을 사용하여 학습 및 테스트해야 합니다. 클라우드로의 데이터 전송은 IPsec을 사용해야 합니다. 웹 애플리케이션은 모든 데이터를 포함하는 PostgreSQL 데이터베이스와 함께 온프레미스에서 호스팅됩니다. 회사는 데이터를 Amazon S3 e에 안전하게 업로드하기를 원합니다
A. AWS Glue 작업을 생성하여 PostgreSQL DB 인스턴스에 연결합니다
B. AWS Glue 작업을 생성하여 PostgreSQL DB 인스턴스에 연결합니다
C. 이블 매핑이 포함된 AWS 데이터베이스 마이그레이션 서비스(AWS DMS)를 사용하여 SSL 연결을 통해 민감한 데이터가 없는 PostgreSQL 테이블을 선택합니다
D. ostgreSQL 논리적 복제를 사용하여 VPN 연결이 있는 AWS Direct Connect를 통해 모든 데이터를 Amazon EC2의 PostgreSQL로 복제합니다
답변 보기
정답: C
질문 #17
한 제조 회사가 Amazon S3 버킷에 정형 및 비정형 데이터를 저장하고 있습니다. 머신 러닝 전문가가 SQL을 사용하여 이 데이터에 대한 쿼리를 실행하려고 합니다. 이 데이터를 쿼리하는 데 가장 적은 노력이 필요한 솔루션은 무엇인가요?
A. AWS 데이터 파이프라인을 사용하여 데이터를 변환하고 Amazon RDS를 사용하여 쿼리를 실행합니다
B. AWS Glue를 사용하여 데이터를 카탈로그화하고 Amazon Athena를 사용하여 쿼리를 실행합니다
C. 이터에 대한 ETL을 실행하려면 AWS Batch를 사용하고 쿼리를 실행하려면 Amazon Aurora를 사용합니다
D. WS Lambda를 사용하여 데이터를 변환하고 Amazon Kinesis 데이터 분석을 사용하여 쿼리를 실행합니다
답변 보기
정답: B
질문 #18
보안에 민감한 회사의 머신 러닝 전문가가 모델 학습을 위한 데이터 세트를 준비하고 있습니다. 데이터 세트는 Amazon S3에 저장되어 있으며 개인 식별 정보(PII)를 포함하고 있습니다.-VPC에서만 액세스할 수 있어야 함.-공용 인터넷을 통과하지 않아야 함.이러한 요구 사항을 어떻게 충족할 수 있을까요?
A. VPC 엔드포인트를 생성하고 지정된 VPC 엔드포인트와 VPC에 대한 액세스를 제한하는 버킷 액세스 정책을 적용합니다
B. PC 엔드포인트를 생성하고 지정된 VPC 엔드포인트와 Amazon EC2 인스턴스에서 액세스를 허용하는 버킷 액세스 정책을 적용합니다
C. PC 엔드포인트를 생성하고 NACL(네트워크 액세스 제어 목록)을 사용하여 지정된 VPC 엔드포인트와 Amazon EC2 인스턴스 간의 트래픽만 허용합니다
D. PC 엔드포인트를 생성하고 보안 그룹을 사용하여 지정된 VPC 엔드포인트와 Amazon EC2 인스턴스에 대한 액세스를 제한합니다
답변 보기
정답: A
질문 #19
머신 러닝 전문가가 Amazon SageMaker에서 학습을 위한 데이터를 준비하고 있습니다. 이 전문가는 학습을 위해 세이지메이커에 내장된 알고리즘 중 하나를 사용하고 있습니다. 데이터 세트는 .CSV 형식으로 저장되어 있으며 훈련 속도에 부정적인 영향을 미치는 것으로 보이는 numpy.array로 변환됩니다. SageMaker에서 훈련을 위해 데이터를 최적화하려면 전문가가 어떻게 해야 하나요?
A. 세이지메이커의 일괄 변환 기능을 사용하여 학습 데이터를 데이터프레임으로 변환합니다
B. AWS Glue를 사용하여 데이터를 Apache Parquet 형식으로 압축합니다
C. 데이터 세트를 RecordIO 프로토부프 형식으로 변환합니다
D. 세이지메이커의 하이퍼파라미터 최적화 기능을 사용하여 데이터를 자동으로 최적화합니다
답변 보기
정답: C
질문 #20
데이터 과학자가 Amazon SageMaker 노트북 인스턴스를 사용하고 있으며 특정 Amazon S3 버킷에 저장된 데이터에 안전하게 액세스해야 하는데, 데이터 과학자는 이를 어떻게 수행해야 하나요?
A. Amazon SageMaker 노트북 ARN을 주 계정으로 하여 GetObject, PutObject 및 ListBucket 권한을 허용하는 S3 버킷 정책을 추가합니다
B. 노트북 소유자만 액세스할 수 있는 사용자 지정 AWS KMS(AWS 키 관리 서비스) 키를 사용해 S3 버킷의 개체를 암호화합니다
C. 특정 S3 버킷에 대한 GetObject, PutObject 및 ListBucket 작업을 허용하는 정책을 노트북과 연결된 IAM 역할에 첨부합니다
D. 명 주기 구성의 스크립트를 사용하여 인스턴스에서 액세스 키 ID와 비밀 번호로 AWS CLI를 구성합니다
답변 보기
정답: C
질문 #21
한 머신 러닝 전문가가 IoT 토양 센서 데이터를 Amazon DynamoDB 테이블에 저장하고 기상 이벤트 데이터를 Amazon S3에 JSON 파일로 저장합니다. DynamoDB의 데이터 세트는 10GB 크기이고 Amazon S3의 데이터 세트는 5GB 크기입니다. 이 전문가는 이 데이터에 대한 모델을 훈련하여 Amazon SageMaker를 사용하여 기상 이벤트의 함수로서 토양 수분 수준을 예측하고자 합니다. 어떤 솔루션이 가장 적은 양의 관리 오버헤드로 Amazon SageMaker 모델을 훈련하는 데 필요한 변환을 수행할 수 있을까요?
A. Amazon EMR 클러스터를 시작합니다
B. AWS Glue 크롤러를 사용해 데이터를 크롤링합니다
C. 센서 테이블에서 Amazon DynamoDB 스트림을 활성화합니다
D. WS Glue 크롤러를 사용해 데이터를 크롤링합니다
답변 보기
정답: D
질문 #22
머신 러닝 전문가가 전 세계 사용자가 있는 뉴스 웹사이트의 댓글을 분석해야 합니다. 이 전문가는 영어 또는 스페인어로 된 댓글에서 가장 많이 논의된 주제를 찾아야 합니다.이 작업을 수행하기 위해 어떤 단계를 사용할 수 있습니까? (두 가지를 선택하세요.)
A. 언어와 독립적으로 주제를 찾기 위해 Amazon SageMaker BlazingText 알고리즘을 사용합니다
B. 필요한 경우 Amazon SageMaker seq2seq 알고리즘을 사용하여 스페인어에서 영어로 번역합니다
C. 필요한 경우 Amazon 번역을 사용하여 스페인어에서 영어로 번역합니다
D. 요한 경우 Amazon 번역을 사용하여 스페인어에서 영어로 번역합니다
E. 필요한 경우 Amazon 번역을 사용하여 스페인어에서 영어로 번역합니다
답변 보기
정답: B
질문 #23
데이터 과학자가 감정 분석을 수행하는 애플리케이션을 개발하고 있습니다. 데이터 과학자는 데이터 세트의 어휘가 풍부하고 단어의 평균 빈도가 낮기 때문에 유효성 검사 정확도가 낮다고 생각하는데, 유효성 검사 정확도를 개선하려면 어떤 도구를 사용해야 하나요?
A. mazon Comprehend 구문 분석 및 엔티티 감지
B. 아마존 세이지메이커 블레이징텍스트 카우 모드
C. 연어 툴킷(NLTK) 어간 및 중지 단어 제거
D. cikit-텀 주파수-역문서 주파수(TF-IDF) 벡터화기
답변 보기
정답: D
질문 #24
한 소매 체인은 Amazon Kinesis Data Firehose를 사용하여 20,000개의 매장 네트워크에서 Amazon S3로 구매 기록을 수집하고 있습니다. 개선된 머신 러닝 모델 학습을 지원하기 위해 학습 기록에는 새롭지만 간단한 변환이 필요하며 일부 속성이 결합됩니다. 매일 모델을 재훈련해야 하는데, 수많은 매장과 레거시 데이터 수집을 고려할 때 가장 적은 개발 노력이 필요한 변경 사항은 무엇일까요?
A. 도 탈락
B. 드러운 L1 손실
C. 프트맥스
D. 류된 선형 단위(ReLU)
답변 보기
정답: D
질문 #25
머신 러닝 전문가가 사용자 지정 알고리즘을 Amazon SageMaker로 가져오고자 합니다. 전문가가 Amazon SageMaker에서 지원하는 Docker 컨테이너에서 알고리즘을 구현하는데, Amazon SageMaker가 트레이닝을 올바르게 시작할 수 있도록 전문가가 Docker 컨테이너를 패키징하려면 어떻게 해야 하나요?
A. 테이너에서 bash_profile 파일을 수정하고 bash 명령을 추가하여 교육 프로그램을 시작합니다
B. 커파일에서 CMD 구성을 사용하여 교육 프로그램을 이미지의 CMD로 추가합니다
C. 육 프로그램을 train이라는 엔트리포인트로 구성합니다
D. 육 프로그램을 /opt/ml/train 디렉토리에 복사합니다
답변 보기
정답: B
질문 #26
한 통신 회사가 고객용 모바일 앱을 개발하고 있습니다. 이 회사는 머신 러닝 모델 추론을 위해 Amazon SageMaker 호스팅 엔드포인트를 사용하고 있으며, 개발자는 앱의 미리 보기 기능에 가입한 제한된 수의 사용자에게 새 버전의 모델을 소개하려고 합니다. 새 버전의 모델을 미리 보기로 테스트한 후 개발자는 모델의 정확도를 평가합니다. 새 버전의 모델이 더 정확도가 높으면 개발자는 새 버전을 점진적으로 출시할 수 있어야 합니다
A. InitialVariantWeight 매개 변수를 0으로 설정한 상태에서 CreateEndpointConfig 작업을 사용하여 새 버전의 모델로 ProductionVariant 데이터 유형을 업데이트합니다
B. 서로 다른 버전의 모델을 제공하는 두 개의 세이지메이커 호스팅 엔드포인트를 구성합니다
C. DesiredWeight 매개 변수를 0으로 설정한 상태에서 UpdateEndpointWeightsAndCapacities 작업을 사용하여 모델의 새 버전으로 DesiredWeightsAndCapacity 데이터 유형을 업데이트합니다
D. 서로 다른 버전의 모델을 제공하는 두 개의 세이지메이커 호스팅 엔드포인트를 구성합니다
답변 보기
정답: D
질문 #27
한 회사에서 데이터 과학 팀을 위해 Amazon SageMaker 노트북 인스턴스를 프로비저닝하고 VPC와 노트북 인스턴스 간의 통신을 보장하기 위해 Amazon VPC 인터페이스 엔드포인트를 생성합니다. Amazon SageMaker API에 대한 모든 연결은 AWS 네트워크를 사용해 전적으로 안전하게 이루어집니다. 하지만 데이터 과학 팀은 VPC 외부의 개인이 여전히 인터넷을 통해 노트북 인스턴스에 연결할 수 있다는 사실을 알게 되었습니다. 이 문제를 해결하기 위해 데이터 과학 팀은 어떤 조치를 취해야 하나요?
A. 노트북 인스턴스의 보안 그룹을 수정하여 VPC의 CIDR 범위의 트래픽만 허용합니다
B. VPC 엔드포인트에서만 sagemaker:CreatePresignedNotebooklnstanceUrl 및 sagemaker:DescribeNotebooklnstance 작업을 허용하는 IAM 정책을 만드세요
C. P에 NAT 게이트웨이 추가 Amazon SageMaker 노트북 인스턴스가 호스팅되는 모든 서브넷을 개인 서브넷으로 변환합니다
D. 트북이 호스팅되는 서브넷의 네트워크 ACL을 변경하여 VPC 외부의 모든 사람에 대한 액세스를 제한합니다
답변 보기
정답: B
질문 #28
한 기술 스타트업은 복잡한 심층 신경망과 GPU 컴퓨팅을 사용하여 각 고객의 습관과 상호 작용을 기반으로 기존 고객에게 회사의 제품을 추천하고 있습니다. 이 솔루션은 현재 Amazon S3 버킷에서 각 데이터 세트를 가져온 다음 로컬에서 실행되는 회사의 Git 리포지토리에서 가져온 TensorFlow 모델에 데이터를 로드합니다. 그런 다음 이 작업은 몇 시간 동안 실행되면서 진행 상황을 동일한 S3 버킷에 계속 출력합니다. 작업을 일시 중지했다가 다시 시작하고 계속할 수 있습니다
A. WS 딥 러닝 컨테이너를 사용하여 솔루션을 구현하고 GPU 호환 스팟 인스턴스에서 AWS 배치(Batch)를 사용하여 컨테이너를 작업으로 실행합니다
B. 저비용 GPU 호환 Amazon EC2 인스턴스를 사용하여 솔루션을 구현하고 AWS 인스턴스 스케줄러를 사용하여 작업을 예약합니다
C. WS 딥 러닝 컨테이너를 사용하여 솔루션을 구현하고, 스팟 인스턴스에서 실행되는 AWS 파게이트를 사용하여 워크로드를 실행한 다음, 내장된 작업 스케줄러를 사용하여 작업을 예약합니다
D. 팟 인스턴스에서 실행되는 Amazon ECS를 사용하여 솔루션을 구현하고 ECS 서비스 스케줄러를 사용하여 작업을 예약합니다
답변 보기
정답: C
질문 #29
한 머신 러닝 전문가는 전 세계 기업의 보안 이벤트를 실시간으로 관리하는 대형 사이버 보안 회사와 협력하고 있습니다. 이 사이버 보안 회사는 머신 러닝을 사용하여 수집되는 데이터에서 악성 이벤트를 이상 징후로 점수화할 수 있는 솔루션을 설계하고자 합니다. 이 회사는 또한 나중에 처리 및 분석을 위해 결과를 데이터 레이크에 저장할 수 있기를 원합니다. 이러한 작업을 수행하는 가장 효율적인 방법은 무엇일까요?
A. 아마존 키네시스 데이터 파이어호스를 사용해 데이터를 수집하고, 이상 징후 탐지를 위해 아마존 키네시스 데이터 분석 랜덤 컷 포레스트(RCF)를 사용합니다
B. Amazon EMR을 사용하여 데이터를 Apache Spark Streaming으로 수집하고, 이상 징후 탐색을 위해 k-means와 함께 Spark MLlib를 사용합니다
C. 데이터를 수집하여 Amazon S3에 저장합니다
D. 이터를 수집하여 Amazon S3에 저장합니다
답변 보기
정답: A
질문 #30
머신 러닝 전문가가 이전에 로컬 머신에서 scikit-learn을 사용하여 로지스틱 회귀 모델을 학습했는데 이제 추론용으로만 프로덕션에 배포하려고 합니다. 로컬에서 학습된 모델을 Amazon SageMaker가 호스팅하려면 어떤 단계를 수행해야 하나요?
A. Amazon DynamoDB와 같은 데이터베이스를 사용하여 이미지를 저장하고 원하는 IAM 사용자만 액세스하도록 IAM 정책을 설정합니다
B. Amazon S3 지원 데이터 레이크를 사용하여 원시 이미지를 저장하고 버킷 정책을 사용하여 권한을 설정합니다
C. 파일을 저장하기 위해 Hadoop 분산 파일 시스템(HDFS)으로 Amazon EMR을 설정하고 IAM 정책을 사용하여 EMR 인스턴스에 대한 액세스를 제한합니다
D. AM 사용자가 소유한 Amazon EC2 인스턴스에서 데이터를 사용할 수 있도록 IAM 정책으로 Amazon EFS를 구성합니다
답변 보기
정답: A
질문 #31
표시된 그래프는 시계열을 테스트하기 위한 예측 모델의 그래프입니다.그래프만 고려할 때 기계 학습 전문가는 이 모델의 동작에 대해 어떤 결론을 내려야 합니까?
A. 모델은 추세와 계절성을 모두 잘 예측합니다
B. 이 모델은 추세를 잘 예측하지만 계절성은 예측하지 못합니다
C. 모델은 계절성은 잘 예측하지만 추세는 예측하지 못합니다
D. 모델은 추세나 계절성을 잘 예측하지 못합니다
답변 보기
정답: A
질문 #32
머신 러닝 전문가가 선형 회귀 및 로지스틱 회귀와 같은 선형 모델을 사용하여 수많은 특징에 대한 예측 모델을 구축하고 있습니다. 탐색적 데이터 분석 중에 많은 특징들이 서로 높은 상관관계를 가지고 있음을 발견했습니다. 이로 인해 모델이 불안정해질 수 있는데, 이렇게 많은 수의 피처가 미치는 영향을 줄이려면 어떻게 해야 하나요?
A. 상관관계가 높은 피처에 대해 원핫 인코딩을 수행합니다
B. 상관관계가 높은 피처에는 행렬 곱셈을 사용합니다
C. 성분 분석(PCA)을 사용하여 새로운 피처 공간 만들기
D. 피어슨 상관 계수를 적용합니다
답변 보기
정답: C
질문 #33
한 금융 서비스 회사가 Amazon S3에 강력한 서버리스 데이터 레이크를 구축하고 있습니다. 데이터 레이크는 유연해야 하며 다음 요구 사항을 충족해야 합니다.-아마존 아테나 및 아마존 레드쉬프트 스펙트럼을 통해 아마존 S3에서 이전 데이터와 새로운 데이터 쿼리 지원.-이벤트 기반 ETL 파이프라인 지원-메타데이터를 빠르고 쉽게 이해할 수 있는 방법 제공이러한 요구 사항을 충족하는 접근 방식은 무엇일까요?
A. AWS Glue 크롤러를 사용하여 S3 데이터를 크롤링하고, AWS Lambda 함수를 사용하여 AWS Glue ETL 작업을 트리거하고, AWS Glue 데이터 카탈로그를 사용하여 메타데이터를 검색 및 발견합니다
B. AWS Glue 크롤러를 사용해 S3 데이터를 크롤링하고, AWS Lambda 함수를 사용해 AWS 배치 작업을 트리거하고, 외부 Apache Hive 메타스토어를 사용해 메타데이터를 검색 및 발견합니다
C. WS Glue 크롤러를 사용하여 S3 데이터를 크롤링하고, Amazon CloudWatch 알람을 사용하여 AWS 배치 작업을 트리거하고, AWS Glue 데이터 카탈로그를 사용하여 메타데이터를 검색 및 발견합니다
D. WS Glue 크롤러를 사용해 S3 데이터를 크롤링하고, Amazon CloudWatch 알람을 사용해 AWS Glue ETL 작업을 트리거하고, 외부 Apache Hive 메타스토어를 사용해 메타데이터를 검색 및 발견합니다
답변 보기
정답: A
질문 #34
한 머신 러닝 전문가가 애플리케이션을 위한 맞춤형 동영상 추천 모델을 개발하고 있습니다. 이 모델을 학습시키는 데 사용되는 데이터 세트는 수백만 개의 데이터 포인트로 매우 방대하며 Amazon S3 버킷에서 호스팅됩니다. 이 데이터는 이동하는 데 몇 시간이 걸리고 노트북 인스턴스의 첨부된 5GB Amazon EBS 볼륨을 초과하기 때문에 이 전문가가 이 모든 데이터를 Amazon SageMaker 노트북 인스턴스에 로드하지 않으려고 하는데, 어떤 접근 방식으로 모든 데이터를 사용하여 모델을 학습시킬 수 있나요?
A. 데이터의 작은 하위 집합을 세이지메이커 노트북에 로드하고 로컬에서 학습합니다
B. AWS 딥 러닝 AMI로 Amazon EC2 인스턴스를 시작하고 S3 버킷을 인스턴스에 연결합니다
C. AWS Glue를 사용하여 데이터의 작은 하위 집합을 사용하여 모델을 학습시켜 데이터가 Amazon SageMaker와 호환되는지 확인합니다
D. 데이터의 작은 하위 집합을 SageMaker 노트북에 로드하고 로컬에서 학습합니다
답변 보기
정답: A
질문 #35
한 회사가 사용 가능한 과거 판매 데이터를 기반으로 주택 판매 가격을 예측하려고 합니다. 회사 데이터 세트의 목표 변수는 판매 가격입니다. 여기에는 부지 크기, 거실 면적 측정값, 비거실 면적 측정값, 침실 수, 욕실 수, 건축 연도 및 우편 번호와 같은 매개 변수가 포함됩니다. 이 회사는 다변량 선형 회귀를 사용하여 주택 판매 가격을 예측하려고 하는데, 머신 러닝 전문가가 관련성이 없는 기능을 제거하려면 어떤 단계를 거쳐야 하나요?
A. 특징의 히스토그램을 그려서 표준 편차를 계산합니다
B. 특징의 히스토그램을 플로팅하고 표준 편차를 계산합니다
C. 데이터 집합의 상관 관계를 보여주는 히트 맵을 작성합니다
D. 목표 변수에 대한 모든 피처의 상관관계 검사를 실행합니다
답변 보기
정답: D
질문 #36
한 트럭 운송 회사는 전 세계 트럭 차량에서 실시간 이미지 데이터를 수집하고 있습니다. 데이터는 빠르게 증가하고 있으며 매일 약 100GB의 새로운 데이터가 생성되고 있습니다. 이 회사는 특정 IAM 사용자만 데이터에 액세스할 수 있도록 하면서 머신 러닝 사용 사례를 탐색하고자 합니다. 어떤 스토리지 옵션이 가장 처리 유연성이 뛰어나고 IAM으로 액세스 제어가 가능할까요?
A. 모든 기능에 대해 자체 상관관계를 실행하고 상관관계가 높은 기능을 제거합니다
B. 모든 숫자 값을 0과 1 사이로 정규화합니다
C. 동 인코더 또는 주성분 분석(PCA)을 사용하여 원래 기능을 새로운 기능으로 대체합니다
D. -평균을 사용하여 원시 데이터를 클러스터링하고 각 클러스터의 샘플 데이터를 사용하여 새 데이터 집합을 구축합니다
답변 보기
정답: C
질문 #37
한 소매업체가 고객 주문을 제품 카탈로그의 제품 설명 데이터와 결합하려고 합니다. 각 데이터 집합의 레코드 구조와 형식이 서로 다릅니다. 데이터 분석가가 스프레드시트를 사용하여 데이터 집합을 결합하려고 시도했지만, 중복된 레코드와 제대로 결합되지 않은 레코드가 발생했습니다. 이 회사는 두 데이터 집합에서 유사한 레코드를 결합하고 중복을 제거하는 데 사용할 수 있는 솔루션이 필요합니다. 이러한 요구 사항을 충족하는 솔루션은 무엇인가요?
A. AWS Lambda 함수를 사용하여 데이터를 처리합니다
B. AWS Glue 데이터 카탈로그를 읽고 채우기 위한 AWS Glue 크롤러를 생성합니다
C. WS Glue 데이터 카탈로그를 읽고 채우기 위해 AWS Glue 크롤러를 생성합니다
D. WS 레이크 형성 사용자 정의 트랜스폼을 생성합니다
답변 보기
정답: C
질문 #38
라벨이 붙지 않은 이미지, 텍스트, 오디오, 비디오 영상으로 구성된 매우 큰 아카이브를 보유한 한 미디어 회사는 연구팀이 관련 콘텐츠를 신속하게 식별할 수 있도록 자산을 색인화하고자 합니다. 이 회사는 머신 러닝 전문 지식이 부족한 사내 연구원들의 작업을 가속화하기 위해 머신 러닝을 사용하고자 하는데, 자산을 색인하는 가장 빠른 방법은 무엇일까요?
A. 아마존 리코그니션, 아마존 컴프리헨드, 아마존 트랜스크라이브를 사용하여 데이터를 별개의 카테고리/클래스로 태그하세요
B. 모든 영상에 레이블을 지정하는 Amazon Mechanical Turk 인간 지능 작업 세트를 생성합니다
C. 아마존 트랜스크라이브를 사용하여 음성을 텍스트로 변환합니다
D. WS 딥러닝 AMI 및 Amazon EC2 GPU 인스턴스를 사용하여 오디오 전사 및 주제 모델링을 위한 사용자 지정 모델을 생성하고 개체 감지 기능을 사용하여 데이터를 별개의 카테고리/클래스로 태그합니다
답변 보기
정답: A
질문 #39
머신러닝(ML) 전문가가 한 금융 서비스 회사를 위한 분류 모델을 개발해야 합니다. 도메인 전문가가 10,000개의 행과 1,020개의 피처가 있는 표 형식의 데이터 집합을 제공합니다. 탐색적 데이터 분석 중에 전문가는 누락된 값과 소수의 중복 행을 발견합니다. 200개의 특징 쌍에 대해 0.9 이상의 상관관계 점수가 있습니다. 각 피처의 평균값은 50번째 백분위수와 비슷합니다.ML 전문가가 Amazo에서 어떤 피처 엔지니어링 전략을 사용해야 하나요?
A. 주성분 분석(PCA) 알고리즘을 사용하여 차원 축소를 적용합니다
B. 관관계 점수가 낮은 기능은 Jupyter 노트북을 사용하여 삭제합니다
C. 덤 컷 포레스트(RCF) 알고리즘을 사용하여 이상 징후 탐지를 적용합니다
D. 주피터 노트북을 사용하여 상관관계 점수가 높은 기능들을 연결합니다
답변 보기
정답: A
질문 #40
한 금융 회사가 신용카드 사기를 탐지하려고 합니다. 이 회사는 평균적으로 신용 카드 거래의 2%가 사기라는 것을 관찰했습니다. 한 데이터 과학자가 1년치 신용카드 거래 데이터로 분류기를 훈련시켰습니다. 이 모델은 정상 거래(포지티브)와 사기 거래(네거티브)를 구분해야 합니다. 회사의 목표는 가능한 한 많은 긍정적인 거래를 정확하게 포착하는 것입니다.데이터 과학자가 모델을 최적화하기 위해 사용해야 하는 메트릭은 무엇입니까? (두 가지를 선택하세요.)
A. 세이지메이커 실행 역할에서 Amazon S3 액세스 권한을 제거합니다
B. CNN 모델의 가중치를 암호화합니다
C. 레이닝 및 검증 데이터 세트를 암호화합니다
D. 육 작업을 위해 네트워크 격리를 사용 설정합니다
답변 보기
정답: AB
질문 #41
한 데이터 과학자가 신경망 분류 모델의 정확도를 개선하려고 합니다. 데이터 과학자는 Amazon SageMaker에서 대규모 하이퍼파라미터 튜닝 작업을 실행하려고 합니다. 하지만 이전에는 동일한 모델에 대한 소규모 튜닝 작업을 몇 주 동안 실행하는 경우가 많았습니다. ML 전문가는 튜닝 작업을 실행하는 데 필요한 계산 시간을 줄이고자 합니다. 하이퍼파라미터 튜닝 작업의 계산 시간을 가장 많이 줄일 수 있는 작업은 무엇인가요? (두 가지를 선택하세요.)
A. 하이퍼밴드 튜닝 전략을 사용합니다
B. 하이퍼파라미터 수를 늘립니다
C. axNumberOfTrainingJobs 매개변수의 값을 낮게 설정합니다
D. 리드 검색 튜닝 전략 사용
E. axParallelTrainingJobs 파라미터의 값을 낮게 설정합니다
답변 보기
정답: AC
질문 #42
데이터 과학자는 고속 실시간 스트리밍 데이터를 위한 서버리스 수집 및 분석 솔루션을 만들어야 하며, 수집 프로세스는 데이터 손실 없이 들어오는 레코드를 버퍼링하고 JSON에서 쿼리에 최적화된 열 형식으로 변환해야 합니다. 출력 데이터 저장소는 가용성이 높아야 하며, 분석가는 데이터에 대해 SQL 쿼리를 실행하고 기존 비즈니스 인텔리전스 대시보드에 연결할 수 있어야 합니다. 데이터 과학자는 어떤 솔루션을 구축해야 요구 사항을 충족할 수 있을까요?
A. 들어오는 데이터 형식의 AWS Glue 데이터 카탈로그에 스키마를 생성합니다
B. 각 JSON 레코드를 Amazon S3의 준비 위치에 씁니다
C. 각 JSON 레코드를 Amazon S3의 준비 위치에 씁니다
D. Amazon Kinesis 데이터 분석을 사용하여 스트리밍 데이터를 수집하고 실시간 SQL 쿼리를 수행하여 Amazon S3로 전송하기 전에 레코드를 Apache Parquet으로 변환합니다
답변 보기
정답: A
질문 #43
한 금융 서비스 회사가 기본 데이터 과학 환경으로 Amazon SageMaker를 채택하려고 합니다. 이 회사의 데이터 과학자들은 기밀 재무 데이터에 대해 머신 러닝(ML) 모델을 실행합니다. 이 회사는 데이터 유출에 대해 걱정하고 있으며 ML 엔지니어가 환경을 보호하기를 원합니다. ML 엔지니어가 SageMaker에서 데이터 유출을 제어하기 위해 사용할 수 있는 메커니즘은 무엇인가요? (세 가지를 선택하세요.)
A. - 데이터 검색, 보강 및 변환을 위한 Amazon EMR - 표준 SQL을 사용하여 Amazon S3에서 결과를 쿼리하고 분석하기 위한 Amazon Athena - 보고 및 인사이트 확보를 위한 Amazon QuickSight
B. - 데이터 수집을 위한 Amazon Kinesis 데이터 분석 - 데이터 검색, 보강 및 변환을 위한 Amazon EMR - Amazon S3에서 결과를 쿼리하고 분석하기 위한 Amazon Redshift
C. 데이터 검색, 보강 및 변환을 위한 AWS Glue-표준 SQL을 사용하여 Amazon S3에서 결과를 쿼리하고 분석하기 위한 Amazon Athena-보고 및 인사이트 확보를 위한 Amazon QuickSight
D. 이터 전송을 위한 AWS 데이터 파이프라인 - 데이터 검색, 보강 및 변환을 위한 AWS Lambda 작업을 오케스트레이션하기 위한 AWS 단계 함수 - 표준 SQL을 사용하여 Amazon S3에서 결과를 쿼리하고 분석하기 위한 Amazon Athena - 보고 및 인사이트 확보를 위한 Amazon QuickSight
답변 보기
정답: BDF
질문 #44
한 데이터 과학 팀이 머신 러닝 모델에 일반적으로 사용되는 대량의 학습 데이터를 저장할 데이터 세트 리포지토리를 설계하고 있습니다. 데이터 과학자는 매일 임의의 수의 새로운 데이터 세트를 생성할 수 있으므로 솔루션은 자동으로 확장되고 비용 효율적이어야 합니다. 또한 SQL을 사용하여 데이터를 탐색할 수 있어야 합니다. 이 시나리오에 가장 적합한 스토리지 체계는 무엇일까요?
A. 제품 재고 변경을 처리할 수 없으므로 모델을 완전히 재설계해야 합니다
B. 모델의 하이퍼파라미터는 드리프트를 방지하기 위해 주기적으로 업데이트해야 합니다
C. 품 재고 변경을 처리하기 위해 정규화 기간을 추가하면서 원본 데이터를 사용하여 주기적으로 모델을 처음부터 다시 학습시켜야 합니다
D. 모델은 원래의 학습 데이터와 제품 재고가 변경되면 새로운 데이터를 사용하여 주기적으로 재학습해야 합니다
답변 보기
정답: A
질문 #45
한 회사가 퀵서비스 레스토랑에서 사용할 줄 세기 애플리케이션을 구축하고 있습니다. 이 회사는 특정 계산대의 고객 줄을 가리키는 비디오 카메라를 사용하여 줄을 서 있는 사람의 수를 측정하고 줄이 너무 길어지면 관리자에게 알림을 전달하려고 합니다. 레스토랑 위치의 외부 서비스 연결 대역폭이 제한되어 있어 다른 작업에 영향을 주지 않고 여러 비디오 스트림을 수용할 수 없습니다.머신 러닝 전문가가 구현해야 하는 솔루션은 무엇입니까?
A. 아마존 키네시스 비디오 스트림과 호환되는 카메라를 설치하여 레스토랑의 기존 인터넷 연결을 통해 데이터를 AWS로 스트리밍합니다
B. 레스토랑에 AWS DeepLens 카메라를 배포하여 비디오를 캡처합니다
C. 식
D. 이미지에 있는 사람의 수를 인식하기 위해 Amazon SageMaker에서 사용자 지정 모델을 구축합니다
E. 이미지에 있는 사람의 수를 인식하기 위해 Amazon SageMaker에서 사용자 지정 모델을 구축합니다
답변 보기
정답: A
질문 #46
한 글로벌 은행은 고객이 은행을 떠나 다른 은행을 선택할지 예측할 수 있는 솔루션이 필요합니다. 이 은행은 데이터 집합을 사용하여 고객 손실을 예측하는 모델을 학습시키고 있습니다. 훈련 데이터 세트에는 1,000개의 행이 있습니다. 훈련 데이터 세트에는 은행을 떠난 고객 100개의 인스턴스가 포함되어 있으며, 머신 러닝(ML) 전문가가 Amazon SageMaker Data Wrangler를 사용하여 SageMaker 훈련 작업을 통해 이탈 예측 모델을 훈련하고 있습니다. 훈련 후, ML 전문가는 모델이 거짓 r만 반환하는 것을 발견합니다
A. 이상 탐지 기능을 적용하여 훈련 전에 훈련 데이터 세트에서 이상값을 제거합니다
B. 훈련 전에 훈련 데이터 세트에 합성 소수 오버샘플링 기법(SMOTE)을 적용합니다
C. 학습 전에 학습 데이터 세트의 특징에 정규화를 적용합니다
D. 훈련 전에 훈련 데이터 세트에 언더샘플링을 적용합니다
답변 보기
정답: B
질문 #47
한 머신러닝 전문가가 이미지 분류 딥러닝 모델을 구축했습니다. 그러나 이 전문가는 훈련 및 테스트 정확도가 각각 99%와 75%인 과적합 문제에 직면했습니다. 이 전문가는 이 문제를 어떻게 해결해야 하며 그 이유는 무엇일까요?
A. Amazon SageMaker API 호출을 Amazon S3에 기록하는 AWS Lambda 함수를 구현합니다
B. AWS CloudTrail을 사용하여 Amazon SageMaker API 호출을 Amazon S3에 기록합니다
C. AWS Lambda 함수를 구현하여 Amazon SageMaker API 호출을 AWS CloudTrail에 기록합니다
D. AWS CloudTrail을 사용하여 Amazon SageMaker API 호출을 Amazon S3에 기록합니다
답변 보기
정답: B
질문 #48
한 소매 회사는 마케팅 캠페인 중에 고객에게 개인화된 상품 추천을 제공하기 위해 Amazon Personalize를 사용하고 있습니다. 이 회사는 새 솔루션 버전을 배포한 직후 기존 고객에 대한 추천 상품 판매가 크게 증가했지만, 배포 후 얼마 지나지 않아 이러한 판매가 감소합니다. 마케팅 캠페인 이전의 과거 데이터만 학습에 사용할 수 있습니다. 데이터 과학자는 솔루션을 어떻게 조정해야 하나요?
A. 실시간 사용자 상호 작용을 포함하려면 Amazon Personalize의 이벤트 추적기를 사용하세요
B. 사용자 메타데이터를 추가하고 Amazon Personalize에서 HRNN-메타데이터 레시피를 사용합니다
C. 아마존 세이지메이커에 내장된 인수분해 기계(FM) 알고리즘을 사용하여 새로운 솔루션을 구현합니다
D. Amazon Personalize의 상호작용 데이터 세트에 이벤트 유형 및 이벤트 값 필드를 추가합니다
답변 보기
정답: A
질문 #49
머신 러닝 전문가가 교육을 위해 Amazon SageMaker를 사용하는 TensorFlow 프로젝트를 배정받았는데 Wi-Fi에 액세스할 수 없는 상태에서 장시간 작업을 계속해야 하는데, 이 전문가가 작업을 계속하려면 어떤 접근 방식을 사용해야 하나요?
A. 노트북에 Python 3와 boto3를 설치하고 해당 환경을 사용하여 코드 개발을 계속합니다
B. Amazon SageMaker에서 사용되는 TensorFlow Docker 컨테이너를 GitHub에서 로컬 환경으로 다운로드하고 Amazon SageMaker Python SDK를 사용하여 코드를 테스트합니다
C. ensorflow
D. 컬 환경에 세이지메이커 노트북을 다운로드한 다음 노트북에 주피터 노트북을 설치하여 로컬 노트북에서 개발을 계속합니다
답변 보기
정답: B
질문 #50
한 대기업의 데이터 과학 팀은 Amazon SageMaker 노트북을 사용해 Amazon S3 버킷에 저장된 데이터에 액세스합니다. IT 보안팀은 인터넷이 지원되는 노트북 인스턴스가 인스턴스에서 실행되는 악성 코드가 데이터 프라이버시를 침해할 수 있는 보안 취약성을 야기할 수 있다고 우려하고 있습니다. 회사에서는 모든 인스턴스가 인터넷에 액세스할 수 없는 보안 VPC 내에 있어야 하며 데이터 통신 트래픽은 AWS 네트워크 내에 있어야 한다고 규정하고 있습니다. 데이터 과학 팀은 노트북을 어떻게 구성해야 하나요?
A. 아마존 세이지메이커 노트북을 VPC의 사설 서브넷과 연결합니다
B. Amazon SageMaker 노트북을 VPC의 사설 서브넷에 연결합니다
C. 아마존 세이지메이커 노트북을 VP의 사설 서브넷과 연결합니다
D. Amazon SageMaker 노트북을 VPC의 개인 서브넷과 연결합니다
답변 보기
정답: C
질문 #51
한 도시에서 대기 오염으로 인한 결과를 해결하기 위해 대기 질을 모니터링하려고 합니다. 머신 러닝 전문가는 도시의 향후 2일 동안의 대기 질을 오염 물질의 백만 분의 일 단위로 예측해야 합니다. 이것은 프로토타입이므로 지난 1년간의 일일 데이터만 사용할 수 있습니다. Amazon SageMaker에서 가장 좋은 결과를 제공할 가능성이 가장 높은 모델은 무엇인가요?
A. 전체 연도의 데이터로 구성된 단일 시계열에 예측자_유형의 회귀 모형으로 Amazon SageMaker k-Nearest-Neighbors(kNN) 알고리즘을 사용합니다
B. 전체 1년간의 데이터로 구성된 단일 시계열에 Amazon SageMaker 랜덤 컷 포레스트(RCF)를 사용합니다
C. 전체 연도의 데이터로 구성된 단일 시계열에 예측자_유형의 회귀 모형으로 Amazon SageMaker 선형 학습자 알고리즘을 사용합니다
D. 분류기 유형이 예측자_유형인 전체 연도의 데이터로 구성된 단일 시계열에 Amazon SageMaker 선형 학습자 알고리즘을 사용합니다
답변 보기
정답: C
질문 #52
한 항공기 엔진 제조 회사는 200개의 성능 메트릭을 시계열로 측정하고 있습니다. 엔지니어들은 테스트 중에 거의 실시간으로 중요한 제조 결함을 감지하기를 원합니다. 오프라인 분석을 위해 모든 데이터를 저장해야 하는데, 실시간에 가까운 결함 탐지를 수행하는 데 가장 효과적인 접근 방식은 무엇일까요?
A. 수집, 저장 및 추가 분석을 위해 AWS IoT Analytics를 사용하세요
B. 수집, 저장 및 추가 분석을 위해 Amazon S3를 사용합니다
C. 수집, 저장 및 추가 분석을 위해 Amazon S3를 사용합니다
D. 집을 위해 Amazon Kinesis Data Firehose를 사용하고 이상 징후 탐색을 수행하기 위해 Amazon Kinesis Data Analytics RCF(Random Cut Forest)를 사용합니다
답변 보기
정답: B
질문 #53
한 머신 러닝 전문가가 백만 개의 문장으로 구성된 데이터 세트를 처리하는 새로운 자연어 처리 애플리케이션을 만들고 있습니다. 목표는 Word2Vec을 실행하여 문장의 임베딩을 생성하고 다양한 유형의 예측을 가능하게 하는 것입니다.다음은 데이터 세트의 예입니다."갈색 여우가 게으른 개를 뛰어넘는다."다음 중 전문가가 반복 가능한 방식으로 데이터를 정확하게 살균하고 준비하기 위해 수행해야 하는 작업은 무엇입니까? (세 가지를 선택하세요.)
A. 현재 문서를 발음 태그를 사용하여 SSML로 변환하세요
B. 적절한 발음 사전을 만듭니다
C. 음을 안내하는 음성 표시를 출력합니다
D. mazon Lex를 사용하여 발음을 위해 텍스트 파일을 사전 처리합니다
답변 보기
정답: BCF
질문 #54
데이터 과학자가 기존 온프레미스 ETL 프로세스를 클라우드로 마이그레이션해야 합니다. 현재 프로세스는 일정한 시간 간격으로 실행되며 PySpark를 사용해 여러 개의 대규모 데이터 소스를 결합하고 포맷하여 다운스트림 처리를 위한 단일 통합 출력으로 변환합니다. 데이터 과학자는 클라우드 솔루션에 대해 다음과 같은 요구 사항을 가지고 있습니다. - 여러 데이터 소스 결합 - 기존 PySpark 로직 재사용 - 기존 일정대로 솔루션 실행 - 관리해야 할 서버 수 최소화
A. 원시 데이터를 Amazon S3에 기록합니다
B. 원시 데이터를 Amazon S3에 씁니다
C. Amazon S3에 원시 데이터를 씁니다
D. Amazon Kinesis 데이터 분석을 사용하여 입력 데이터를 스트리밍하고 스트림에 대해 실시간 SQL 쿼리를 수행하여 스트림 내에서 필요한 변환을 수행합니다
답변 보기
정답: D
질문 #55
한 회사의 머신 러닝 전문가가 TensorFlow를 사용해 시계열 예측 모델의 학습 속도를 개선해야 합니다. 이 훈련은 현재 단일 GPU 머신에서 구현되고 있으며 완료하는 데 약 23시간이 소요됩니다. 이 훈련은 매일 실행해야 하며, 모델 정확도는 양호하지만 훈련 데이터의 크기가 지속적으로 증가하고 매일이 아닌 매시간마다 모델을 업데이트해야 할 것으로 예상하고 있습니다. 또한 이 회사는 코딩 작업을 최소화하고자 합니다
A. 텐서플로우 코드를 변경하지 마세요
B. 아마존 세이지메이커에서 지원하는 Horovod 분산 프레임워크를 구현하도록 텐서플로우 코드를 변경합니다
C. 본 제공 AWS SageMaker DeepAR 모델을 사용하도록 전환합니다
D. 교육을 Amazon EMR로 이동하고 비즈니스 목표를 달성하는 데 필요한 만큼의 머신에 워크로드를 분산합니다
답변 보기
정답: B
질문 #56
영화 분류 모델에 대한 다음 혼동 행렬이 주어졌을 때, 로맨스에 대한 실제 클래스 빈도와 모험에 대한 예측 클래스 빈도는 얼마인가요?
A. 맨스의 실제 클래스 빈도는 77
B. 로맨스의 실제 클래스 빈도는 57
C. 로맨스의 실제 클래스 빈도는 0
D. 로맨스의 실제 클래스 빈도는 77
답변 보기
정답: B
질문 #57
한 머신 러닝 전문가가 여러 개의 ETL 작업이 포함된 일일 ETL 워크플로우를 개발하고 있습니다. 워크플로는 다음과 같은 프로세스로 구성됩니다.-데이터가 Amazon S3에 업로드되는 즉시 워크플로우 시작.-모든 데이터 집합을 Amazon S3에서 사용할 수 있게 되면, 업로드된 데이터 집합을 이미 Amazon S3에 저장된 여러 테라바이트 크기의 데이터 집합과 조인하는 ETL 작업을 시작.-데이터 집합 조인 결과를 Amazon S3에 저장.-작업 중 하나가 실패하면 관리자에게 알림 보내기.어떤 구성이 좋을까요?
A. AWS Lambda를 사용하여 AWS 단계 함수 워크플로우를 트리거하여 Amazon S3에서 데이터 세트 업로드가 완료될 때까지 기다립니다
B. AWS Lambda를 사용해 ETL 워크플로우를 개발하여 Amazon SageMaker 노트북 인스턴스를 시작합니다
C. 데이터가 Amazon S3에 업로드될 때 ETL 작업의 시작을 트리거하기 위해 AWS Batch를 사용하여 ETL 워크플로우를 개발합니다
D. 데이터가 Amazon S3에 업로드되는 즉시 다른 Lambda 함수를 연결하여 Amazon S3에서 데이터 세트를 읽고 조인하도록 AWS Lambda를 사용하세요
답변 보기
정답: A
질문 #58
데이터 과학자가 여러 클래스가 있는 데이터 세트에 대해 다층 인식(MLP)을 훈련하고 있습니다. 관심 대상 클래스는 데이터 세트 내의 다른 클래스와 비교했을 때 고유하지만 리콜 메트릭을 달성하지 못합니다. 데이터 과학자는 이미 MLP의 숨겨진 레이어의 수와 크기를 다양하게 시도해 보았지만 결과가 크게 개선되지 않았습니다. 회상률을 개선하기 위한 솔루션을 최대한 빨리 구현해야 하는데, 이러한 요구 사항을 충족하려면 어떤 기술을 사용해야 할까요?
A. 아마존 메카니컬 터크를 사용하여 더 많은 데이터를 수집한 다음 재교육하기
B. MLP 대신 이상 징후 탐지 모델 훈련하기
C. LP 대신 XGBoost 모델 트레이닝
D. LP의 손실 함수에 클래스 가중치를 추가한 다음 다시 학습합니다
답변 보기
정답: D
질문 #59
머신러닝 전문가에게 회사 고객층의 쇼핑 습관에 대한 구조화된 데이터 세트가 주어집니다. 이 데이터 세트에는 수천 개의 데이터 열과 각 고객에 대한 수백 개의 숫자 열이 포함되어 있습니다. 이 전문가는 모든 고객에서 이러한 열에 대한 자연스러운 그룹화가 있는지 파악하고 가능한 한 빨리 결과를 시각화하고자 합니다. 이 작업을 수행하려면 어떤 접근 방식을 취해야 할까요?
A. t-분산 확률적 이웃 임베딩(t-SNE) 알고리즘을 사용하여 수치 특징을 임베딩하고 산점도를 생성합니다
B. 다양한 k 값에 대해 유클리드 거리 측정값을 사용하여 k-평균을 실행하고 엘보우 플롯을 만듭니다
C. t-분산 확률적 이웃 임베딩(t-SNE) 알고리즘을 사용하여 수치 특징을 임베딩하고 선 그래프를 생성합니다
D. 양한 k 값에 대해 유클리드 거리 측정값을 사용하여 k-평균을 실행하고 각 클러스터 내의 각 숫자 열에 대해 박스형 플롯을 만듭니다
답변 보기
정답: A
질문 #60
한 대형 모바일 네트워크 운영 회사가 서비스 탈퇴 가능성이 높은 고객을 예측하기 위해 머신 러닝 모델을 구축하고 있습니다. 이 회사는 이탈 비용이 인센티브 비용보다 훨씬 크기 때문에 이러한 고객에게 인센티브를 제공할 계획입니다.이 모델은 100명의 고객으로 구성된 테스트 데이터 세트에서 평가한 후 다음과 같은 혼동 행렬을 생성합니다.모델 평가 결과에 따르면, 이 모델이 생산에 적합한 이유는 무엇인가요?
A. 이 모델의 정확도는 86%이며 오탐으로 인해 발생하는 비용이 오탐으로 인해 발생하는 비용보다 적습니다
B. 모델의 정확도는 86%로 모델의 정확도보다 낮습니다
C. 모델의 정확도는 86%이며 오탐으로 인해 회사가 부담하는 비용은 오탐보다 적습니다
D. 모델의 정확도는 86%로 모델의 정확도보다 높습니다
답변 보기
정답: A
질문 #61
신용카드 처리 회사에서 일하는 머신러닝 전문가는 거의 실시간으로 어떤 거래가 사기일 수 있는지 예측해야 합니다. 구체적으로, 이 전문가는 특정 거래가 사기일 확률을 반환하는 모델을 훈련해야 하는데, 이 비즈니스 문제를 어떻게 구성해야 할까요?
A. 트리밍 분류
B. 진 분류
C. 중 카테고리 분류
D. 귀 분류
답변 보기
정답: C
질문 #62
머신러닝 전문가가 다양한 경제 요인을 기반으로 미래 고용률을 예측하는 모델을 구축하고 있습니다. 전문가가 데이터를 탐색하는 동안 입력된 특징의 크기가 매우 다양하다는 것을 발견했습니다. 이 전문가는 더 큰 규모의 변수가 모델을 지배하는 것을 원하지 않습니다. 모델 학습을 위해 데이터를 준비하려면 어떻게 해야 할까요?
A. 사분위수 비닝을 적용하여 데이터를 범주형 구간차원으로 그룹화하여 크기를 분포로 대체함으로써 데이터의 모든 관계를 유지합니다
B. 데카르트 곱 변환을 적용하여 크기와 무관한 새로운 필드 조합을 만듭니다
C. 정규화를 적용하여 각 필드의 평균이 0이 되고 분산이 1이 되도록 하여 유의미한 크기를 제거합니다
D. 교 스파스 빅그램(OSB) 변환을 적용하여 고정 크기 슬라이딩 창을 적용하여 비슷한 크기의 새로운 피처를 생성합니다
답변 보기
정답: C
질문 #63
한 직원이 회사의 소셜 미디어 피드에서 오디오가 포함된 동영상 클립을 발견했습니다. 동영상에 사용된 언어는 스페인어입니다. 직원의 모국어는 영어이며 스페인어를 이해하지 못합니다. 이 직원은 감정 분석을 하고 싶어하는데, 어떤 서비스 조합이 작업을 수행하는 데 가장 효율적일까요?
A. 아마존 트랜스크라이브, 아마존 번역 및 아마존 컴프리헨드
B. 아마존 트랜스크라이브, 아마존 컴프리헨드 및 아마존 세이지메이커 seq2seq
C. 아마존 트랜스크라이브, 아마존 번역 및 아마존 세이지메이커 신경 주제 모델(NTM)
D. 마존 트랜스크라이브, 아마존 번역 및 아마존 세이지메이커 블레이징 텍스트
답변 보기
정답: A
질문 #64
분류 문제에 대한 신경망의 미니 배치 훈련 중에 데이터 과학자가 훈련 정확도가 진동하는 것을 발견했습니다. 이 문제의 가장 가능성이 높은 원인은 무엇인가요?
A. 데이터 세트의 클래스 분포가 불균형합니다
B. 데이터 세트 셔플링이 비활성화됩니다
C. 배치 크기가 너무 큽니다
D. 학습률이 매우 높습니다
답변 보기
정답: D
질문 #65
한 농업 회사는 100에이커 규모의 초원에서 특정 유형의 잡초를 감지하기 위해 머신 러닝을 사용하는 데 관심이 있습니다. 현재 이 회사는 트랙터에 장착된 카메라를 사용하여 10×10 격자로 구성된 여러 이미지를 캡처하고 있습니다. 이 회사는 또한 광엽 및 비광엽 도크와 같은 인기 잡초 클래스의 주석이 달린 이미지로 구성된 대규모 학습 데이터 세트를 보유하고 있으며, 특정 유형의 잡초와 각 유형의 위치를 감지하는 잡초 감지 모델을 구축하고자 합니다
A. 이미지를 RecordIO 형식으로 준비하여 Amazon S3에 업로드합니다
B. 이미지를 Apache Parquet 형식으로 준비하고 Amazon S3에 업로드합니다
C. 이미지를 RecordIO 형식으로 준비하여 Amazon S3에 업로드합니다
D. 이미지를 Apache Parquet 형식으로 준비하여 Amazon S3에 업로드합니다
답변 보기
정답: C
질문 #66
한 데이터 과학자가 몇 주 동안 Amazon SageMaker 노트북 인스턴스를 실행해 왔습니다. 이 기간 동안 추가 소프트웨어 업데이트와 함께 새 버전의 Jupyter Notebook이 출시되었습니다. 보안 팀은 실행 중인 모든 SageMaker 노트북 인스턴스가 SageMaker에서 제공하는 최신 보안 및 소프트웨어 업데이트를 사용하도록 요구하고 있는데, 데이터 과학자가 이 요구 사항을 어떻게 충족할 수 있을까요?
A. reateNotebookInstanceLifecycleConfig API 작업을 호출합니다
B. 새 SageMaker 노트북 인스턴스를 생성하고 원본 인스턴스에서 Amazon EBS(Amazon Elastic Block Store) 볼륨을 마운트합니다
C. 이지메이커 노트북 인스턴스를 중지했다가 다시 시작합니다
D. pdateNotebookInstanceLifecycleConfig API 작업을 호출합니다
답변 보기
정답: C
질문 #67
한 전자상거래 회사가 이미지를 기반으로 제품 분류를 자동화하고 있습니다. 데이터 과학자가 Amazon SageMaker 이미지 분류 알고리즘을 사용하여 컴퓨터 비전 모델을 학습시켰습니다. 각 제품의 이미지는 특정 제품 라인에 따라 분류됩니다. 새로운 제품을 분류할 때 모델의 정확도가 너무 낮습니다. 모든 제품 이미지는 동일한 치수를 가지며 Amazon S3 버킷에 저장됩니다. 회사는 새로운 제품 분류에 사용할 수 있도록 모델을 개선하고자 합니다
A. 클래스 C와 D는 너무 비슷합니다
B. 데이터 집합이 너무 작아서 홀드아웃 교차 검증을 수행할 수 없습니다
C. 데이터 분포가 왜곡되어 있습니다
D. 모델은 클래스 B 및 E에 과도하게 적합합니다
답변 보기
정답: BCE

View The Updated Microsoft Exam Questions

SPOTO Provides 100% Real Microsoft Exam Questions for You to Pass Your Microsoft Exam!

제출 후 답변 보기

질문에 대한 답변을 얻으려면 이메일과 WhatsApp을 제출하세요.

참고: 올바른 시험 결과를 얻을 수 있도록 이메일 ID와 Whatsapp이 유효한지 확인하십시오.

이메일:
WhatsApp/전화번호: