아무것도 놓치고 싶지 않으신가요?

인증 시험 합격 팁

최신 시험 소식 및 할인 정보

전문가가 선별하고 최신 정보를 제공합니다.

예, 뉴스레터를 보내주세요

효과적인 준비를 위한 AWS MLS-C01 시험 문제 | AWS 공인 개발자 - Associate

AWS 공인 머신러닝 - 스페셜티(MLS-C01) 시험을 준비하려면 종합적인 접근 방식이 필요합니다. 가장 효과적인 준비 방법 중 하나는 고품질의 시험 문제와 답안, 시험 문제, 모의고사를 활용하는 것입니다. 이러한 리소스는 지식을 평가하는 데 도움이 될 뿐만 아니라 시험의 형식과 예상되는 문제 유형에 대한 귀중한 통찰력을 제공합니다. SPOTO와 같은 평판이 좋은 업체는 시험 문제, 시험 준비 가이드, 모의고사 등 다양한 학습 자료를 제공합니다. 이러한 자료는 주제별 전문가가 신중하게 제작하고 최신 시험 목표에 따라 최신 상태로 유지됩니다. 이러한 학습 보조 자료를 통해 자신의 강점과 약점을 파악하여 개선이 필요한 부분에 집중적으로 노력할 수 있습니다. 또한 SPOTO의 모의고사는 실제 시험 환경을 시뮬레이션하여 자신감을 키우고 시간 제약과 문제 형식에 익숙해지도록 도와줍니다. 이러한 시험 리소스를 활용하고 부지런히 연습하면 첫 번째 시도에서 AWS Certified Machine Learning - Specialty 자격증 시험에 성공적으로 합격할 확률을 높일 수 있습니다.
다른 온라인 시험에 응시하세요

질문 #1
온라인 도서관을 운영하는 한 회사에서 Amazon Lex를 사용하여 카테고리를 기반으로 도서 추천을 제공하는 챗봇을 구현하고 있습니다. 이러한 의도는 특정 카테고리가 주어지면 Amazon DynamoDB 테이블에 책 제목 목록을 쿼리하는 AWS Lambda 함수를 통해 달성됩니다. 테스트를 위해 사용자 지정 슬롯 유형으로 구현된 카테고리는 세 가지뿐입니다: "코미디", "어드벤처", "다큐멘터리"머신 러닝(ML) 전문가는 Amazon Lex가 때때로 요청을 이행할 수 없다는 사실을 발견했습니다
A. 열거형 값 목록에서 인식할 수 없는 단어를 슬롯 유형에 새 값으로 추가합니다
B. 새 사용자 지정 슬롯 유형을 만들고 이 슬롯 유형에 인식할 수 없는 단어를 열거형 값으로 추가한 다음 이 슬롯 유형을 슬롯에 사용합니다
C. 데이터베이스의 사용자 지정 검색에는 AMAZON
D. 식할 수 없는 단어를 사용자 지정 슬롯 유형에 동의어로 추가합니다
답변 보기
정답: D
질문 #2
한 의료 영상 회사는 컴퓨터 비전 모델을 훈련시켜 환자의 CT 스캔에서 우려되는 영역을 감지하고자 합니다. 이 회사는 각 환자와 연결되어 Amazon S3 버킷에 저장된 라벨이 없는 대량의 CT 스캔 컬렉션을 보유하고 있습니다. 이 스캔은 승인된 사용자만 액세스할 수 있어야 합니다. 머신 러닝 엔지니어가 라벨링 파이프라인을 구축해야 하는데, 최소한의 노력으로 라벨링 파이프라인을 구축하기 위해 엔지니어가 취해야 할 단계는 무엇인가요?
A. 신뢰도가 낮은 예측을 아마존 세이지메이커 기반 진실로 라우팅하도록 아마존 텍스트랙을 구성합니다
B. 비동기 작업 대신 Amazon Textract 동기 작업을 사용합니다
C. 신뢰도가 낮은 예측을 Amazon A2I(Amazon 증강 AI)로 라우팅하도록 Amazon Textract를 구성합니다
D. 이미지의 텍스트를 감지하는 Amazon Rekognition의 기능을 사용하여 스캔한 이미지에서 데이터를 추출합니다
답변 보기
정답: C
질문 #3
머신러닝 전문가가 온라인 쇼핑 웹사이트의 고객 데이터를 수신합니다. 이 데이터에는 인구 통계, 과거 방문 기록, 지역 정보가 포함됩니다. 머신러닝 전문가는 고객의 쇼핑 패턴, 선호도, 트렌드를 파악하여 더 나은 서비스와 스마트한 추천을 위해 웹사이트를 개선하기 위한 머신러닝 접근 방식을 개발해야 하는데, 어떤 솔루션을 추천해야 할까요?
A. 고객 데이터베이스의 패턴을 식별하기 위해 주어진 불연속 데이터 컬렉션에 대한 잠재 디리클레 할당(LDA)을 사용합니다
고객 데이터베이스의 패턴을 식별하기 위해 최소 3개의 레이어와 무작위 초기 가중치로 구성된 B. 신경망
C. 사용자 상호작용 및 상관관계를 기반으로 협업 필터링하여 고객 데이터베이스의 패턴을 식별합니다
D. 작위 하위 샘플에 대한 랜덤 컷 포레스트(RCF)를 통해 고객 데이터베이스의 패턴을 식별합니다
답변 보기
정답: C
질문 #4
클라우드 연결 기기를 제공하여 건강한 수면 패턴을 장려하는 한 회사는 현재 AWS에서 수면 추적 애플리케이션을 호스팅하고 있습니다. 이 애플리케이션은 기기 사용자로부터 기기 사용 정보를 수집합니다. 이 회사의 데이터 과학 팀은 사용자가 회사 디바이스 사용을 중단할지 여부와 시기를 예측하기 위한 머신 러닝 모델을 구축하고 있습니다. 이 모델의 예측은 사용자에게 연락하기 위한 최선의 방법을 결정하는 다운스트림 애플리케이션에서 사용됩니다
A. Amazon SageMaker에서 여러 모델을 빌드하고 호스팅합니다
B. Amazon SageMaker에서 여러 모델을 빌드하고 호스팅합니다
C. 양한 유형의 의료 기기를 고려하여 Amazon SageMaker Neo에서 여러 모델을 빌드하고 호스팅합니다
D. mazon SageMaker에서 여러 모델을 빌드하고 호스팅합니다
답변 보기
정답: D
질문 #5
머신러닝 전문가는 학습을 준비하기 위해 데이터를 이동하고 변환해야 합니다. 일부 데이터는 거의 실시간으로 처리해야 하고, 다른 데이터는 매시간 이동할 수 있습니다. 데이터를 정리하고 데이터에 대해 수행할 기능 엔지니어링이 있는 기존 Amazon EMR MapReduce 작업이 있습니다. 다음 중 MapReduce 작업에 데이터를 공급할 수 있는 서비스는 무엇입니까? (두 개를 선택하세요.)
A. 추론 코드를 사용하여 Docker 이미지를 빌드합니다
B. 학습된 모델을 직렬화하여 배포를 위해 형식이 압축되도록 합니다
C. 학습된 모델을 직렬화하여 배포할 수 있도록 형식을 압축합니다
D. 론 코드를 사용하여 Docker 이미지를 빌드합니다
답변 보기
정답: BC
질문 #6
한 기계 학습 전문가가 k = [1..10]에 대한 k-평균의 결과를 보여주는 다음 그래프를 준비했습니다: 이 그래프를 고려할 때, k를 최적으로 선택하기 위한 합리적인 선택은 무엇일까요?
A.
B.
C.
D. 0
답변 보기
정답: B
질문 #7
공개 웹사이트에서 수천 개의 제품을 판매하는 한 회사는 잠재적인 내구성 문제가 있는 제품을 자동으로 식별하고자 합니다. 이 회사에는 날짜, 별점, 리뷰 텍스트, 리뷰 요약, 고객 이메일 필드가 있는 1,000개의 리뷰가 있지만 많은 리뷰가 불완전하고 빈 필드가 있습니다. 각 리뷰에는 이미 올바른 내구성 결과가 표시되어 있으며, 머신러닝 전문가는 제품 내구성에 대한 우려를 표현하는 리뷰를 식별하기 위해 모델을 학습시켜야 합니다. 첫 번째 모델에는 다음이 필요합니다
A. 아마존 컴프리드를 사용하여 사용자 지정 분류기를 훈련하세요
B. luon과 Apache MXNet을 사용하여 Amazon SageMaker에서 순환 신경망(RNN)을 구축합니다
C. 아마존 세이지메이커에서 Word2Vec 모드를 사용하여 기본 제공 블레이징 텍스트 모델을 훈련합니다
D. Amazon SageMaker에 내장된 seq2seq 모델을 사용합니다
답변 보기
정답: B
질문 #8
한 머신 러닝 전문가가 피자를 주문할지 여부를 예측하는 로지스틱 회귀 모델을 구축하고 있습니다. 이 전문가는 이상적인 분류 임계값을 사용하여 최적의 모델을 구축하려고 하는데, 다양한 분류 임계값이 모델의 성능에 어떤 영향을 미치는지 이해하기 위해 어떤 모델 평가 기법을 사용해야 하나요?
A. 수신기 동작 특성(ROC) 곡선
B. 분류율
C. 균제곱근오차(RMSE)
D. 1 표준
답변 보기
정답: A
질문 #9
한 머신 러닝 전문가가 Amazon SageMaker를 사용하여 시계열 예측을 수행할 모델을 구축하고 있습니다. 전문가가 모델 학습을 마쳤으며 이제 엔드포인트에서 로드 테스트를 수행하여 모델 변형에 대한 자동 확장을 구성할 계획입니다. 로드 테스트 중에 전문가가 지연 시간, 메모리 사용률 및 CPU 사용률을 검토할 수 있는 접근 방식은 무엇인가요?
A. Amazon Athena 및 Amazon QuickSight를 활용하여 Amazon S3에 기록된 SageMaker 로그를 검토하여 로그가 생성되는 동안 시각화합니다
B. Amazon SageMaker에서 출력되는 지연 시간, 메모리 사용률 및 CPU 사용률 메트릭에 대한 단일 보기를 생성하기 위해 Amazon CloudWatch 대시보드를 생성합니다
C. 용자 정의 Amazon CloudWatch 로그를 구축한 다음 Amazon ES와 Kibana를 활용하여 Amazon SageMaker에서 생성되는 로그 데이터를 쿼리하고 시각화합니다
D. Amazon SageMaker에서 생성한 Amazon CloudWatch 로그를 Amazon ES로 전송하고 Kibana를 사용하여 로그 데이터를 쿼리 및 시각화합니다
답변 보기
정답: B
질문 #10
한 회사에서 Amazon SageMaker의 기본 내장 이미지 분류 알고리즘으로 학습하는 동안 정확도가 낮다는 것을 관찰하고 있습니다. 데이터 과학 팀은 ResNet 아키텍처 대신 Inception 신경망 아키텍처를 사용하려고 하는데, 다음 중 이를 달성할 수 있는 것은 무엇인가요? (두 가지를 선택하세요.)
A. 최적화 프로세스가 로컬 최소값에 갇혀 있기 때문에 학습 속도를 높여야 합니다
B. 모델이 충분히 일반화되지 않았기 때문에 평탄화 레이어에서의 드롭아웃 비율을 높여야 합니다
C. 모델이 충분히 복잡하지 않으므로 평평한 레이어 옆의 밀도가 높은 레이어의 치수를 늘려야 합니다
D. 최적화 프로세스가 글로벌 최소값에 도달하기 전에 종료되었으므로 에포크 수를 늘려야 합니다
답변 보기
정답: CD
질문 #11
한 대기업이 다양한 운영 메트릭에서 수집한 데이터를 사용하여 보고서와 대시보드를 생성하는 BI 애플리케이션을 개발했습니다. 이 회사는 경영진이 자연어를 사용하여 보고서에서 데이터를 얻을 수 있도록 향상된 환경을 제공하고자 합니다. 이 회사는 경영진이 서면 및 음성 인터페이스를 사용하여 질문할 수 있기를 원합니다.이 대화형 인터페이스를 구축하는 데 사용할 수 있는 서비스 조합은 무엇입니까? (세 가지를 선택하세요.)
A. Amazon SageMaker 노트북 인스턴스에 모델을 업로드하고 Amazon SageMaker HPO 기능을 사용하여 모델의 하이퍼파라미터를 최적화합니다
B. 훈련 세트에 더 많은 데이터를 추가하고 전이 학습을 사용하여 모델을 재훈련하여 편향을 줄입니다
C. 미지넷에서 사전 학습된 레이어가 더 많은 신경망 모델을 사용하고 전이 학습을 적용하여 분산도를 높입니다
D. 재 신경망 아키텍처를 사용하여 새 모델을 학습합니다
답변 보기
정답: BEF
질문 #12
머신 러닝 팀은 Amazon SageMaker에서 자체 학습 알고리즘을 실행합니다. 학습 알고리즘에는 외부 자산이 필요합니다. 팀은 자체 알고리즘 코드와 알고리즘 관련 매개 변수를 모두 Amazon SageMaker에 제출해야 합니다. Amazon SageMaker에서 사용자 지정 알고리즘을 구축하려면 어떤 서비스 조합을 사용해야 하나요? (두 가지를 선택하세요.)
A. 0
B. 0
C. 00
D. ,400
답변 보기
정답: CE
질문 #13
한 제조 회사에는 레이블이 지정된 대량의 과거 판매 데이터 세트가 있습니다. 제조업체는 특정 부품의 분기별 생산량을 예측하고자 합니다. 이 문제를 해결하려면 어떤 머신 러닝 접근 방식을 사용해야 할까요?
A. 지스틱 회귀
B. 덤 컷 포레스트(RCF)
C. 성분 분석(PCA)
D. 형 회귀
답변 보기
정답: B
질문 #14
한 사무실 보안 기관은 본사 내 주요 위치에 설치된 100대의 카메라를 사용하여 성공적인 파일럿을 실시했습니다. 카메라의 이미지는 Amazon S3에 업로드되고 Amazon Rekognition을 사용하여 태그가 지정되었으며, 그 결과는 Amazon ES에 저장되었습니다. 이 기관은 이제 이 파일럿 시스템을 전 세계 사무실에 있는 수천 대의 비디오 카메라를 사용하는 전체 생산 시스템으로 확장할 계획입니다. 목표는 비직원이 수행하는 활동을 실시간으로 식별하는 것입니다.기관이 고려해야 할 솔루션은 무엇입니까?
A. 각 지역 사무실과 각 카메라에 프록시 서버를 사용하고 RTSP 피드를 고유한 Amazon Kinesis 비디오 스트림 비디오 스트림으로 스트리밍합니다
B. 각 지역 사무실과 각 카메라에 프록시 서버를 사용하고 RTSP 피드를 고유한 Amazon Kinesis 비디오 스트림 비디오 스트림으로 스트리밍합니다
C. WS 딥렌즈 카메라를 설치하고 딥렌즈_키네시스_비디오 모듈을 사용하여 각 카메라에 대해 아마존 키네시스 비디오 스트림으로 비디오를 스트리밍합니다
D. WS DeepLens 카메라를 설치하고 DeepLens_Kinesis_Video 모듈을 사용하여 각 카메라에 대해 Amazon Kinesis 비디오 스트림으로 비디오를 스트리밍합니다
답변 보기
정답: A
질문 #15
머신 러닝 전문가가 엔드포인트 자동 확장 구성에 적합한 SageMakerVariantInvocationsPerInstance 설정을 결정하려고 합니다. 이 전문가는 단일 인스턴스에서 부하 테스트를 수행한 결과 서비스 저하가 없는 초당 최대 요청 수(RPS)가 약 20RPS임을 확인했습니다. 첫 번째 배포이므로 전문가는 명시된 매개 변수를 기반으로 인스턴스당 호출 설정이 측정된 것을 고려하여 호출 안전율을 0.5로 설정하려고 합니다
A. 에너지 분야와 관련된 대규모 뉴스 기사 모음에서 사전 학습된 용어 빈도-역 문서 빈도(TF-IDF) 벡터로 단어를 초기화합니다
B. LSTM 대신 GRU(게이트 반복 단위)를 사용하고 검증 손실이 감소하지 않을 때까지 훈련 프로세스를 실행합니다
C. 학습 속도를 낮추고 학습 손실이 더 이상 감소하지 않을 때까지 학습 프로세스를 실행합니다
D. 에너지 분야와 관련된 방대한 뉴스 기사 모음에서 사전 학습된 word2vec 임베딩으로 단어를 초기화합니다
답변 보기
정답: C
질문 #16
한 은행에서 저금리 신용 프로모션을 시작하려고 합니다. 이 은행은 최근 경제적으로 어려움을 겪은 한 마을에 위치하고 있습니다. 은행의 고객 중 일부만 경제 위기의 영향을 받았기 때문에 은행의 신용팀은 어떤 고객을 대상으로 프로모션을 진행할지 파악해야 합니다. 하지만 신용팀은 결정을 내릴 때 충성도가 높은 고객의 전체 신용 이력을 고려하고자 합니다. 은행의 데이터 과학 팀은 계좌 거래를 분류하고 신용 등급을 이해하는 모델을 개발했습니다
A. 아마존 세이지메이커 스튜디오를 사용하여 모델을 재구축합니다
B. 아마존 세이지메이커 스튜디오를 사용하여 모델을 다시 빌드합니다
C. 마존 세이지메이커 노트북 인스턴스를 생성합니다
D. 아마존 세이지메이커 스튜디오를 사용하여 모델을 재구축합니다
답변 보기
정답: C
질문 #17
한 제조업체는 복잡한 공급망 관계로 다수의 공장을 운영하고 있으며, 한 기계의 예기치 않은 다운타임으로 인해 여러 공장의 생산이 중단될 수 있습니다. 데이터 과학자는 공장의 센서 데이터를 분석하여 선제적 유지보수가 필요한 장비를 파악한 다음 서비스 팀을 파견하여 예기치 않은 다운타임을 방지하고자 합니다. 단일 기계의 센서 판독값에는 온도, 전압, 진동, RPM, 압력 등 최대 200개의 데이터 포인트가 포함될 수 있습니다
A. Amazon SageMaker에 모델을 배포합니다
B. 각 공장의 AWS IoT Greengrass에 모델을 배포합니다
C. Amazon SageMaker 일괄 변환 작업에 모델을 배포합니다
D. Amazon SageMaker에 모델을 배포하고 IoT 규칙을 사용하여 Amazon DynamoDB 테이블에 데이터를 씁니다
답변 보기
정답: B
질문 #18
머신 러닝 전문가가 분류 문제에 대해 나이브 베이지안 모델과 전체 베이지안 네트워크 중 어떤 것을 구축할지 결정하고 있습니다. 전문가가 각 특징 간의 피어슨 상관 계수를 계산한 결과 절대값이 0.1에서 0.95 사이임을 발견했습니다. 이 상황에서 기본 데이터를 설명하는 모델은 어느 것일까요?
A. 진한 베이지안 모델, 모든 피처가 조건부 독립적이기 때문입니다
B. 베이지안 네트워크는 모든 기능이 조건부 독립적이기 때문입니다
C. 부 기능은 통계적으로 종속적이기 때문에 순진한 베이지안 모델입니다
일부 기능은 통계적으로 종속적이기 때문에 전체 베이지안 네트워크입니다.
답변 보기
정답: D
질문 #19
데이터 과학자가 선형 회귀 모델을 구축 중이며 결과 p값을 사용하여 각 계수의 통계적 유의성을 평가합니다. 데이터 과학자는 데이터 집합을 검사한 결과, 대부분의 특징이 정규 분포에 있음을 발견합니다. 데이터 집합의 한 특징의 플롯이 그래픽에 표시되어 있는데, 데이터 과학자가 선형 회귀 모델의 통계적 가정을 만족시키기 위해 어떤 변환을 적용해야 할까요?
A. 지수 변환
B. 그 변환
C. 항식 변환
D. 현파 변환
답변 보기
정답: B
질문 #20
데이터 엔지니어가 고객 신용카드 정보가 포함된 데이터 세트를 사용하여 모델을 구축해야 하는데, 데이터 엔지니어는 데이터가 암호화되어 있고 신용카드 정보가 안전한지 어떻게 확인할 수 있을까요?
A. 사용자 지정 암호화 알고리즘을 사용하여 데이터를 암호화하고 아마존 세이지메이커 인스턴스의 VPC에 데이터를 저장합니다
B. IAM 정책을 사용하여 Amazon S3 버킷 및 Amazon Kinesis의 데이터를 암호화하여 신용카드 번호를 자동으로 폐기하고 가짜 신용카드 번호를 삽입합니다
C. Amazon SageMaker 시작 구성을 사용하여 VP의 SageMaker 인스턴스에 복사된 데이터를 암호화합니다
D. AWS KMS를 사용하여 Amazon S3 및 Amazon SageMaker의 데이터를 암호화하고 AWS Glue로 고객 데이터에서 신용 카드 번호를 삭제합니다
답변 보기
정답: D
질문 #21
대화형 온라인 사전에서 비슷한 문맥에서 사용되는 단어를 표시하는 위젯을 추가하려고 합니다. 머신 러닝 전문가에게 위젯을 구동하는 다운스트림 가장 가까운 이웃 모델에 단어 기능을 제공하라는 요청을 받았습니다. 이러한 요구 사항을 충족하려면 전문가가 어떻게 해야 할까요?
A. 원핫워드 인코딩 벡터를 생성합니다
B. Amazon Mechanical Turk를 사용하여 모든 단어에 대한 동의어 집합을 생성합니다
C. 다른 모든 단어와의 편집 거리를 저장하는 단어 임베딩 벡터를 만듭니다
D. 규모 말뭉치에서 사전 학습된 단어 임베딩을 다운로드합니다
답변 보기
정답: D
질문 #22
머신 러닝 전문가가 뉴욕시의 대중 교통을 설명하는 데이터 세트에 대해 전체 베이지안 네트워크를 구현하고 있습니다. 무작위 변수 중 하나는 불연속형이며 버스가 10분마다 순환하고 평균이 3분인 경우 뉴욕 시민들이 버스를 기다리는 시간을 나타냅니다. ML 전문가는 이 변수에 대해 어떤 사전 확률 분포를 사용해야 합니까?
A. 아송 분포
B. 일한 분포
C. 규 분포
D. 항 분포
답변 보기
정답: A
질문 #23
한 머신 러닝 전문가가 보안이 주요 관심사인 정부 사용자를 위한 개념 증명을 개발하고 있습니다. 이 전문가는 사진 분류기 애플리케이션을 위한 컨볼루션 신경망(CNN) 모델을 훈련하기 위해 Amazon SageMaker를 사용하고 있습니다. 이 전문가는 훈련 컨테이너에 실수로 설치된 악성 코드가 데이터에 액세스하여 원격 호스트로 전송할 수 없도록 데이터를 보호하려고 하는데, 가장 안전하게 보호할 수 있는 조치는 무엇인가요?
A. AWS ID 및 액세스 관리(IAM)로 인력을 생성합니다
B. 아마존 메카니컬 터크 인력 및 매니페스트 파일을 생성합니다
C. 인 인력 및 매니페스트 파일을 생성합니다
D. 마존 코그니토로 인력을 생성합니다
답변 보기
정답: D
질문 #24
머신 러닝 전문가는 스트리밍 데이터를 수집하여 탐색 및 분석을 위해 Apache Parquet 파일에 저장할 수 있어야 합니다.다음 중 이 데이터를 올바른 형식으로 수집하고 저장하는 서비스는 무엇입니까?
A. WS DMS
B. 아마존 키네시스 데이터 스트림
C. 마존 키네시스 데이터 파이어호스
D. 아마존 키네시스 데이터 분석
답변 보기
정답: C
질문 #25
머신 러닝 전문가가 AWS KMS를 사용해 서버 측 암호화로 보호되는 Amazon S3 버킷에 데이터 세트를 업로드합니다. 머신 러닝 전문가가 Amazon S3에서 동일한 데이터 세트를 읽을 수 있도록 Amazon SageMaker 노트북 인스턴스를 어떻게 정의해야 하나요?
A. 모든 HTTP 인바운드/아웃바운드 트래픽을 허용하는 보안 그룹을 정의하고 해당 보안 그룹을 Amazon SageMaker 노트북 인스턴스에 할당합니다
B. VPC에 액세스할 수 있도록 Amazon SageMaker 노트북 인스턴스를 구성합니다
C. 데이터 세트에 대한 S3 읽기 액세스 권한이 있는 Amazon SageMaker 노트북에 IAM 역할을 할당합니다
D. Amazon S3에서 데이터를 암호화하는 데 사용된 것과 동일한 KMS 키를 Amazon SageMaker 노트북 인스턴스에 할당합니다
답변 보기
정답: D
질문 #26
머신 러닝 전문가가 여러 데이터 과학자가 노트북에 액세스하고, 모델을 학습하고, 엔드포인트를 배포할 수 있도록 Amazon SageMaker를 구성하고 있습니다. 최상의 운영 성능을 보장하기 위해, 전문가는 과학자들이 모델을 배포하는 빈도, 배포된 SageMaker 엔드포인트의 GPU 및 CPU 사용률, 엔드포인트가 호출될 때 생성되는 모든 오류를 추적할 수 있어야 합니다. 이 정보를 추적하기 위해 Amazon SageMaker와 통합되는 서비스는 무엇인가요? (두 가지를 선택하세요.)
A. 스토어가 Amazon S3에 로드하기 위해 AWS 스토리지 게이트웨이에서 로컬로 데이터를 캡처하도록 전환한 다음 AWS Glue를 사용하여 변환을 수행해야 합니다
B. 변환 로직이 포함된 Apache Spark를 실행하는 Amazon EMR 클러스터를 배포하고, 이 클러스터가 매일 Amazon S3에 누적되는 레코드에 대해 실행되어 새/변환된 레코드를 Amazon S3로 출력하도록 합니다
C. 환 로직으로 Amazon EC2 인스턴스를 스핀업하고, Amazon S3에 축적되는 데이터 레코드를 변환하도록 한 다음, 변환된 레코드를 Amazon S3로 출력합니다
D. SQL을 사용하여 원시 레코드 속성을 간단한 변환된 값으로 변환하는 Amazon Kinesis 데이터 분석 스트림을 Kinesis 데이터 파이어호스 스트림의 다운스트림에 삽입합니다
답변 보기
정답: AD
질문 #27
데이터 과학자는 온라인 소매 회사를 위해 Amazon SageMaker에서 맞춤형 추천 모델을 구축해야 합니다. 이 회사의 제품 특성상 고객은 5~10년마다 4~5개의 제품만 구매합니다. 따라서 이 회사는 꾸준한 신규 고객 유입에 의존하고 있습니다. 신규 고객이 가입하면 회사는 고객의 선호도에 대한 데이터를 수집합니다. 아래는 데이터 과학자가 사용할 수 있는 데이터의 샘플입니다. 데이터 과학자는 이 사용 사례에서 데이터 집합을 학습 및 테스트 집합으로 어떻게 분할해야 할까요?
A. 모든 인터랙션 데이터를 셔플합니다
B. 각 사용자에 대한 가장 최근 10%의 상호작용을 식별합니다
C. 상호작용 데이터가 가장 적은 10%의 사용자를 식별합니다
D. 사용자의 10%를 무작위로 선택합니다
답변 보기
정답: D
질문 #28
한 데이터 과학자가 Amazon SageMaker에 내장된 BlazingText 알고리즘을 사용해 텍스트 분류 모델을 훈련하고 있습니다. 데이터 세트에는 카테고리 A 300개, 카테고리 B 292개, 카테고리 C 240개, 카테고리 D 258개, 카테고리 E 310개의 5개 클래스가 있으며, 데이터 과학자는 데이터를 섞어 테스트를 위해 10%를 분할합니다. 모델을 훈련한 후 데이터 과학자는 훈련 및 테스트 세트에 대한 혼동 행렬을 생성합니다. 데이터 과학자는 어떤 결론을 내릴 수 있을까요?
A. 자동 회귀 통합 이동 평균(AIRMA)
B. 수 평활화(ETS)
C. 볼루션 신경망 - 사분위수 회귀(CNN-QR)
D. 언자
답변 보기
정답: A
질문 #29
한 머신 러닝 전문가가 목표 지표로 ROC 곡선 아래 면적(AUC)을 사용하는 Amazon SageMaker를 사용해 트리 기반 앙상블 모델의 하이퍼파라미터 튜닝 작업을 시작합니다. 이 워크플로는 결국 24시간마다 부실해지는 데이터에 대한 클릭을 모델링하기 위해 매일 밤 하이퍼파라미터를 재훈련하고 조정하는 파이프라인에 배포될 것입니다. 이러한 모델을 훈련하는 데 걸리는 시간을 줄이고 궁극적으로 비용을 절감하기 위해 전문가는 입력을 재구성하려고 합니다
가장 중요한 입력 피처가 가우시안인지 여부를 보여주는 히스토그램입니다.
B. 은 입력 변수를 읽기 쉬운 차원으로 시각화하기 위해 t-SNE(분산 확률 이웃 임베딩)를 사용하여 대상 변수별로 색상이 지정된 점이 있는 분산형 차트로, 많은 수의 입력 변수를 시각화합니다
C. 훈련 반복에 대한 목표 지표의 성능을 보여주는 산점도입니다
최대 트리 깊이와 객관적 지표 간의 상관관계를 보여주는 분산형 차트입니다.
답변 보기
정답: B
질문 #30
한 회사가 고객에게 온라인 쇼핑 서비스를 제공합니다. 이 회사는 고객이 평소 위치와 다른 위치에서 사이트에 접속할 때 추가 정보를 요청하여 사이트의 보안을 강화하고자 합니다. 이 회사는 추가 정보 요청 시기를 결정하기 위해 머신 러닝(ML) 모델을 호출하도록 프로세스를 업데이트하려고 합니다. 이 회사는 기존 전자상거래 웹 서버에서 각 요청의 소스 IP 주소가 포함된 수 테라바이트의 데이터를 보유하고 있습니다
A. Amazon SageMaker Ground Truth를 사용하여 각 레코드에 성공 또는 실패 액세스 시도로 레이블을 지정합니다
B. Amazon SageMaker를 사용하여 IP 인사이트 알고리즘을 사용하여 모델을 학습시킵니다
C. Amazon SageMaker Ground Truth를 사용하여 각 레코드에 성공 또는 실패 액세스 시도로 레이블을 지정합니다
D. mazon SageMaker를 사용하여 Object2Vec 알고리즘을 사용하여 모델을 학습시킵니다
답변 보기
정답: B
질문 #31
데이터 과학자가 GZIP 파일의 데이터 스트림에 대한 실시간 인사이트를 얻고자 합니다. 어떤 솔루션이 가장 지연 시간이 가장 짧은 SQL을 사용하여 스트림을 쿼리할 수 있을까요?
A. 데이터를 변환하는 AWS 람다 함수가 포함된 Amazon Kinesis 데이터 분석
데이터를 변환하기 위해 사용자 정의 ETL 스크립트가 포함된 B. WS Glue를 사용합니다
C. 이터를 변환하여 Amazon ES 클러스터에 저장하는 Amazon Kinesis 클라이언트 라이브러리입니다
데이터를 변환하여 Amazon S3 버킷에 넣는 Amazon Kinesis 데이터 파이어호스.
답변 보기
정답: A
질문 #32
제품 카탈로그의 수석 편집자가 연구 개발 팀에 이미지 모음에서 개인이 회사의 소매 브랜드를 착용하고 있는지 여부를 감지하는 데 사용할 수 있는 머신 러닝 시스템을 구축하기를 원합니다. 팀에는 학습 데이터 세트가 있는데, 어떤 머신 러닝 알고리즘을 사용해야 요구 사항을 가장 잘 충족할 수 있을까요?
A. 복 디리클레 할당(LDA)
B. 환신경망(RNN)
C. 수단
D. 볼루션 신경망(CNN)
답변 보기
정답: D
질문 #33
온라인 패션 회사에서 일하는 머신 러닝 전문가가 회사의 Amazon S3 기반 데이터 레이크를 위한 데이터 수집 솔루션을 구축하려고 합니다.이 전문가는 다음과 같은 미래 기능을 지원하는 수집 메커니즘 세트를 만들고자 합니다.-실시간 분석-기록 데이터의 대화형 분석-클릭스트림 분석-제품 추천전문가는 어떤 서비스를 사용해야 하나요?
데이터 카탈로그로서의 A. WS Glue, 실시간 데이터 인사이트를 위한 Amazon Kinesis 데이터 스트림 및 Amazon Kinesis 데이터 분석, 클릭스트림 분석을 위해 Amazon ES로 전송하는 Amazon Kinesis 데이터 파이어호스, 개인화된 상품 추천을 생성하기 위한 Amazon EMR
B. 데이터 카탈로그로서 Amazon Athena: 실시간에 가까운 데이터 인사이트를 위한 Amazon Kinesis 데이터 스트림 및 Amazon Kinesis 데이터 분석, 클릭스트림 분석을 위한 Amazon Kinesis 데이터 파이어호스, 개인화된 상품 추천을 생성하기 위한 AWS Glue
데이터 카탈로그로서의 C. WS Glue, 과거 데이터 인사이트를 위한 Amazon Kinesis 데이터 스트림 및 Amazon Kinesis 데이터 분석, 클릭스트림 분석을 위해 Amazon ES로 전송하는 Amazon Kinesis 데이터 파이어호스, 개인화된 상품 추천을 생성하는 Amazon EMR
데이터 카탈로그로서의 D. mazon Athena, 과거 데이터 인사이트를 위한 Amazon Kinesis 데이터 스트림 및 Amazon Kinesis 데이터 분석, 클릭스트림 분석을 위한 Amazon DynamoDB 스트림, 개인화된 상품 추천을 생성하기 위한 AWS Glue
답변 보기
정답: A
질문 #34
데이터 과학자가 스트리밍 웹 트래픽 데이터를 수집하기 위한 파이프라인을 개발하고 있습니다. 데이터 과학자는 파이프라인의 일부로 비정상적인 웹 트래픽 패턴을 식별하는 프로세스를 구현해야 합니다. 이 패턴은 경보 및 사고 대응을 위해 다운스트림에서 사용됩니다. 데이터 과학자는 필요한 경우 레이블이 없는 기록 데이터에 액세스하여 사용할 수 있습니다. 솔루션은 다음을 수행해야 합니다. -각 웹 트래픽 항목에 대한 이상 징후 점수 계산 -시간에 따른 웹 패턴 변화에 맞춰 비정상 이벤트 식별 조정
A. 과거 웹 트래픽 데이터를 사용하여 Amazon SageMaker RCF(Random Cut Forest) 기본 제공 모델을 사용하여 이상 징후 탐지 모델을 학습합니다
B. 기록 웹 트래픽 데이터를 사용하여 Amazon SageMaker에 내장된 XGBoost 모델을 사용하여 이상 징후 탐지 모델을 학습시킵니다
C. 아마존 키네시스 데이터 파이어호스를 사용하여 스트리밍 데이터를 수집합니다
D. 아마존 키네시스 데이터 파이어호스를 사용하여 스트리밍 데이터를 수집합니다
답변 보기
정답: D
질문 #35
한 머신러닝 전문가가 10가지 유형의 동물을 분류할 컨볼루션 신경망(CNN)을 구축하고 있습니다. 이 전문가는 신경망에 동물의 입력 이미지를 가져와서 일련의 컨볼루션 및 풀링 레이어를 통과한 다음 최종적으로 10개의 노드가 완전히 연결된 조밀하고 완전히 연결된 레이어를 통과하는 일련의 레이어를 구축했습니다. 전문가는 신경망에서 입력 이미지가 다음과 같이 나타날 확률 분포의 출력을 얻고자 합니다
A. 평균제곱근오차(RMSE)
B. 여 플롯
C. 선 아래 면적
D. 동 매트릭스
답변 보기
정답: C
질문 #36
한 회사에서 사용자 행동을 사기 또는 정상으로 분류하고자 합니다. 머신 러닝 전문가가 내부 조사에 따라 계정 연령과 거래 월이라는 두 가지 특징을 기반으로 이진 분류기를 구축하려고 합니다. 제공된 그림에 이러한 특징에 대한 클래스 분포가 나와 있는데, 이 정보를 바탕으로 어떤 모델이 가장 높은 정확도를 보일까요?
A. 확장 지수 선형 단위(SELU)를 사용한 장단기 메모리(LSTM) 모델
B. 지스틱 회귀
C. 선형 커널을 사용한 서포트 벡터 머신(SVM)
D. 탄 활성화 기능이 있는 단일 퍼셉트론
답변 보기
정답: C
질문 #37
한 소매 회사의 개발자가 일일 수요 예측 모델을 만들고 있습니다. 이 회사는 시간별 과거 수요 데이터를 Amazon S3 버킷에 저장합니다. 그러나 과거 데이터에는 일부 시간의 수요 데이터가 포함되어 있지 않습니다. 개발자는 자동 회귀 통합 이동 평균(ARIMA) 접근 방식이 사용 사례에 적합한 모델인지 확인하려고 합니다. 개발자는 ARIMA 접근 방식의 적합성을 어떻게 검증해야 하나요?
A. 아마존 세이지메이커 데이터 랭글러를 사용합니다
B. 아마존 세이지메이커 오토파일럿을 사용합니다
C. 아마존 세이지메이커 데이터 랭글러를 사용합니다
D. 아마존 세이지메이커 오토파일럿을 사용합니다
답변 보기
정답: A
질문 #38
한 머신 러닝 전문가가 Amazon SageMaker를 트레이닝에 활용할 수 있도록 맞춤형 ResNet 모델을 Docker 컨테이너에 패키징하고 있습니다. 이 전문가는 Amazon EC2 P3 인스턴스를 사용하여 모델을 트레이닝하고 있으며, NVIDIA GPU를 활용하기 위해 도커 컨테이너를 올바르게 구성해야 합니다. 이 전문가는 무엇을 해야 하나요?
A. NVIDIA 드라이버를 Docker 이미지와 번들로 제공합니다
B. NVIDIA-Docker와 호환되도록 Docker 컨테이너를 빌드합니다
C. PU 인스턴스에서 실행되도록 Docker 컨테이너의 파일 구조를 구성합니다
D. 마존 세이지메이커 CreateTrainingJob 요청 본문에서 GPU 플래그를 설정합니다
답변 보기
정답: B
질문 #39
반려동물 보험 회사의 마케팅 관리자는 신규 고객을 확보하기 위해 소셜 미디어에서 타겟팅 마케팅 캠페인을 시작할 계획입니다. 현재 이 회사는 Amazon Aurora에 다음과 같은 데이터를 보유하고 있습니다: - 모든 과거 및 기존 고객의 프로필 - 모든 과거 및 기존 피보험 반려동물의 프로필 - 정책 수준 정보 - 받은 보험료 - 지급된 보험금소셜 미디어에서 잠재적인 신규 고객을 식별하기 위해 기계 학습 모델을 구현하려면 어떤 단계를 수행해야 하나요?
A. 고객 프로필 데이터에 회귀 분석을 사용하여 소비자 세그먼트의 주요 특성을 파악합니다
B. 고객 프로필 데이터에 클러스터링을 사용하여 소비자 세그먼트의 주요 특성을 파악합니다
C. 객 프로필 데이터에 추천 엔진을 사용하여 소비자 세그먼트의 주요 특성을 파악합니다
D. 고객 프로필 데이터에 의사 결정 트리 분류 엔진을 사용하여 소비자 세그먼트의 주요 특성을 파악합니다
답변 보기
정답: C
질문 #40
머신 러닝 전문가는 Amazon Athena를 사용하여 Amazon S3에서 데이터 세트를 쿼리하는 프로세스를 구축해야 합니다. 이 데이터 세트에는 일반 텍스트 CSV 파일로 저장된 80만 개 이상의 레코드가 포함되어 있습니다. 각 레코드는 200개의 열을 포함하며 크기는 약 1.5MB입니다. 대부분의 쿼리는 5~10개의 열에만 걸쳐 있습니다. 머신 러닝 전문가가 쿼리 런타임을 최소화하기 위해 데이터 세트를 어떻게 변환해야 할까요?
A. 레코드를 Apache Parquet 형식으로 변환합니다
B. 레코드를 JSON 형식으로 변환합니다
C. 코드를 GZIP CSV 형식으로 변환합니다
D. 레코드를 XML 형식으로 변환합니다
답변 보기
정답: A
질문 #41
한 부동산 회사가 과거 데이터 집합을 기반으로 주택 가격을 예측하는 머신 러닝 모델을 만들고자 합니다. 데이터 세트에는 32개의 기능이 포함되어 있는데, 어떤 모델이 비즈니스 요구 사항을 충족할까요?
A. 지스틱 회귀
B. 형 회귀
C. 수단
D. 성분 분석(PCA)
답변 보기
정답: B
질문 #42
한 의료 회사에서 신경망을 사용하여 엑스레이 이미지를 정상과 비정상으로 분류할 계획입니다. 레이블이 지정된 데이터는 1,000개의 이미지로 구성된 훈련 세트와 200개의 이미지로 구성된 테스트 세트로 나뉩니다. 50개의 숨겨진 레이어가 있는 신경망 모델의 초기 훈련에서 훈련 세트의 정확도는 99%였지만 테스트 세트의 정확도는 55%에 불과했습니다.이 문제를 해결하기 위해 전문가가 고려해야 할 변경 사항은 무엇입니까? (세 가지를 선택하세요.)
A. 조기 정지
B. 적절한 시드로 가중치 무작위 초기화
C. 포크 수 늘리기
D. 00개의 뉴런으로 다른 레이어 추가하기
답변 보기
정답: BDF
질문 #43
머신 러닝 전문가가 일반적으로 머신 러닝 분류 모델을 서로 비교/평가할 때 사용하는 메트릭은 다음 중 어느 것인가요?
A. 콜
B. 분류율
C. 균 절대 백분율 오류(MAPE)
D. OC 곡선 아래 면적(AUC)
답변 보기
정답: D
질문 #44
34가지 치약 종류-48가지 칫솔 종류-43가지 구강 청결제 종류이 모든 제품의 전체 판매 내역은 Amazon S3에서 확인할 수 있습니다. 현재 이 회사는 이러한 제품에 대한 수요를 예측하기 위해 맞춤형 자동 회귀 통합 이동 평균(ARIMA) 모델을 사용하고 있습니다. 이 회사는 곧 출시될 신제품의 수요를 예측하고자 하는데, 머신 러닝 스피킹에 어떤 솔루션을 사용해야 할까요?
A. 사용자 지정 ARIMA 모델을 훈련하여 신제품에 대한 수요를 예측합니다
B. 신제품에 대한 수요를 예측하기 위해 Amazon SageMaker DeepAR 알고리즘을 학습시킵니다
C. 새로운 제품에 대한 수요를 예측하기 위해 Amazon SageMaker k-평균 클러스터링 알고리즘을 훈련합니다
D. 춤형 XGBoost 모델을 훈련하여 신제품에 대한 수요를 예측합니다
답변 보기
정답: B
질문 #45
한 게임 회사가 무료로 게임을 시작할 수 있지만 특정 기능을 사용하려면 유료로 전환해야 하는 온라인 게임을 출시했습니다. 이 회사는 신규 사용자가 1년 이내에 유료 사용자가 될지 여부를 예측하는 자동화된 시스템을 구축해야 합니다. 이 회사는 1백만 명의 사용자로부터 레이블이 지정된 데이터 세트를 수집했습니다. 학습 데이터 세트는 1,000개의 양성 샘플(1년 이내에 결제를 완료한 사용자)과 999,000개의 음성 샘플(유료 기능을 사용하지 않은 사용자)로 구성됩니다
A. 연령이 0으로 설정된 데이터 세트에서 모든 레코드를 삭제합니다
B. 값이 0인 레코드의 연령 필드 값을 데이터 집합의 평균 또는 중앙값으로 바꿉니다
C. 데이터 세트에서 연령 기능을 삭제하고 나머지 기능을 사용하여 모델을 학습시킵니다
D. 락된 기능을 처리하기 위해 K-평균 클러스터링 사용
답변 보기
정답: CD
질문 #46
한 회사에서 마케팅 캠페인을 위한 머신 러닝(ML) 모델을 학습하고 호스팅하기 위해 Amazon SageMaker를 사용합니다. 대부분의 데이터는 민감한 고객 데이터입니다. 데이터는 미사용 시 암호화되어야 합니다. 회사는 AWS가 마스터 키에 대한 신뢰점을 유지하기를 원하며 암호화 키 사용량을 기록하기를 원하는데, 이러한 요구 사항을 충족하는 구현은 무엇인가요?
A. AWS 클라우드 HSM에 저장된 암호화 키를 사용하여 ML 데이터 볼륨을 암호화하고 모델 아티팩트와 Amazon S3의 데이터를 암호화합니다
B. SageMaker에 내장된 임시 키를 사용하여 ML 데이터 볼륨을 암호화합니다
C. WS 키 관리 서비스(AWS KMS)의 고객 관리 키를 사용하여 ML 데이터 볼륨을 암호화하고 모델 아티팩트와 데이터를 Amazon S3에서 암호화합니다
D. WS STS(AWS 보안 토큰 서비스)를 사용하여 임시 토큰을 생성하여 ML 스토리지 볼륨을 암호화하고 Amazon S3에서 모델 아티팩트와 데이터를 암호화합니다
답변 보기
정답: C
질문 #47
한 회사에서 사용자 행동을 사기 또는 정상으로 분류하고자 합니다. 내부 연구를 바탕으로 머신 러닝 전문가가 계정 연령(x로 표시)과 거래 월(y로 표시)이라는 두 가지 특징을 기반으로 이진 분류기를 구축합니다. 클래스 분포는 제공된 그림에 설명되어 있습니다. 양수 클래스는 빨간색으로 표시되어 있고 음수 클래스는 검은색으로 표시되어 있습니다. 어떤 모델이 가장 높은 정확도를 가질까요?
A. 형 서포트 벡터 머신(SVM)
B. 사 결정 트리
C. 사형 기저 함수 커널이 있는 서포트 벡터 머신(SVM)
D. 활성화 기능이 있는 단일 퍼셉트론
답변 보기
정답: C
질문 #48
한 데이터 과학 팀이 자연어 처리(NLP) 애플리케이션을 구축할 계획입니다. 애플리케이션의 텍스트 전처리 단계에는 품사 태깅과 주요 단계 추출이 포함됩니다. 전처리된 텍스트는 데이터 과학 팀이 이미 작성하고 Apache MXNet을 사용하여 학습한 사용자 지정 분류 알고리즘에 입력될 것입니다. 이 팀이 이러한 요구 사항을 충족하기 위해 가장 빠르게 구축할 수 있는 솔루션은 무엇인가요?
A. 품사 태깅, 주요 단계 추출 및 분류 작업에는 Amazon Comprehend를 사용하세요
B. 품사 태깅을 위해 Amazon SageMaker의 NLP 라이브러리를 사용합니다
C. 품사 태깅 및 주요 단계 추출 작업에는 Amazon Comprehend를 사용합니다
D. 사 태깅 및 주요 단계 추출 작업에는 Amazon Comprehend를 사용합니다
답변 보기
정답: B
질문 #49
한 온라인 리셀러가 데이터의 30%가 누락된 한 열이 있는 대규모의 다중 열 데이터 집합을 보유하고 있습니다. 머신 러닝 전문가가 데이터 집합의 특정 열을 사용하여 누락된 데이터를 재구성할 수 있다고 생각합니다. 데이터 집합의 무결성을 유지하기 위해 어떤 재구성 방식을 사용해야 하나요?
A. 록 삭제
B. 지막 관찰 이월
C. 중 대입
D. 균 대체
답변 보기
정답: C
질문 #50
한 회사가 신제품을 출시하면서 소셜 미디어에서 회사와 신제품에 대한 댓글을 모니터링할 수 있는 메커니즘을 구축해야 합니다. 이 회사는 소셜 미디어 게시물에 표현된 감정을 평가하고 추세를 시각화하고 다양한 임계값에 따라 알람을 구성할 수 있어야 하며, 이 솔루션을 신속하게 구현하고 메시지를 평가하는 데 필요한 인프라 및 데이터 과학 리소스를 최소화하기를 원합니다. 이 회사는 이미 소셜 미디어 게시물을 수집하는 솔루션을 갖추고 있습니다
A. 소셜 미디어 게시물 말뭉치에서 감정을 감지하기 위해 BlazingText 알고리즘을 사용하여 Amazon SageMaker에서 모델을 훈련합니다
B. 시맨틱 세분화 알고리즘을 사용하여 소셜 미디어 게시물 코퍼스에서 시맨틱 콘텐츠를 모델링하여 Amazon SageMaker에서 모델을 훈련합니다
C. 셜 미디어 게시물이 S3 버킷에 추가되면 AWS Lambda 함수를 트리거합니다
소셜 미디어 게시물이 S3 버킷에 추가되면 AWS Lambda 함수를 트리거합니다. 각 게시물에 대해 Amazon Comprehend를 호출하여 메시지의 감정을 캡처하고 사용자 정의 Amazon CloudWatch 메트릭과 S3에 감정을 기록합니다
답변 보기
정답: D
질문 #51
한 데이터 과학자가 각 환자에 대해 수집한 정보와 치료 계획을 기반으로 향후 환자 결과를 예측하는 머신러닝 모델을 개발하고 있습니다. 이 모델은 예측값으로 연속값을 출력해야 합니다. 사용 가능한 데이터에는 4,000명의 환자 세트에 대한 레이블이 지정된 결과가 포함됩니다. 이 연구는 나이가 들면서 악화되는 것으로 알려진 특정 질병을 앓고 있는 65세 이상의 개인 그룹을 대상으로 진행되었으며, 초기 모델의 성능은 좋지 않았습니다. 기초 데이터를 검토하는 동안
A. 데이터 집합을 Amazon S3에 파일로 저장합니다
B. 데이터세트를 Amazon EC2 인스턴스에 연결된 Amazon EBS 볼륨에 파일로 저장합니다
C. 장 데이터세트를 멀티노드 Amazon Redshift 클러스터에 테이블로 저장합니다
D. tore 데이터 집합을 Amazon DynamoDB의 글로벌 테이블로 저장합니다
답변 보기
정답: D
질문 #52
한 회사에서 매일 100TB의 예측을 생성하는 머신 러닝 예측 서비스를 운영하고 있습니다. 머신 러닝 전문가는 예측에서 일일 정밀도-재콜 곡선의 시각화를 생성하고 읽기 전용 버전을 비즈니스 팀에 전달해야 합니다. 코딩 작업이 가장 적게 필요한 솔루션은 무엇인가요?
A. 매일 Amazon EMR 워크플로우를 실행하여 정밀 리콜 데이터를 생성하고 그 결과를 Amazon S3에 저장하세요
B. Amazon QuickSight에서 매일 정밀 리콜 데이터를 생성하고 그 결과를 비즈니스 팀과 공유하는 대시보드에 게시합니다
C. 매일 Amazon EMR 워크플로우를 실행하여 정밀 리콜 데이터를 생성하고 그 결과를 Amazon S3에 저장합니다
D. Amazon ES에서 매일 정밀 리콜 데이터를 생성하고 그 결과를 비즈니스 팀과 공유하는 대시보드에 게시합니다
답변 보기
정답: C
질문 #53
한 머신 러닝 전문가가 장기적으로 실행되는 Amazon EMR 클러스터를 만들 계획입니다. EMR 클러스터에는 마스터 노드 1개, 코어 노드 10개, 작업 노드 20개가 있습니다. 비용을 절감하기 위해 이 전문가는 EMR 클러스터에서 스팟 인스턴스를 사용할 예정인데, 스팟 인스턴스에서 어떤 노드를 시작해야 하나요?
A. 스터 노드
B. 든 코어 노드
C. 업 노드 중 하나
D. 어 및 작업 노드 모두
답변 보기
정답: C
질문 #54
한 데이터 과학자가 지도 학습 작업의 모델링 단계를 준비하기 위해 데이터 집합을 탐색하고 위생 처리했습니다. 통계적 분산은 기능 간에 크게 다를 수 있으며, 때로는 몇 배나 차이가 날 수도 있습니다. 데이터 과학자는 모델링 단계로 넘어가기 전에 생산 데이터에 대한 예측 성능이 가능한 한 정확한지 확인하고자 합니다. 이러한 요구 사항을 충족하려면 데이터 과학자가 수행해야 하는 단계의 순서는 무엇입니까?
A. 데이터 세트에 무작위 샘플링을 적용합니다
B. 데이터 세트를 학습, 검증 및 테스트 세트로 분할합니다
C. 데이터 세트의 규모를 다시 조정합니다
D. 데이터 집합을 학습, 검증, 테스트 집합으로 분할합니다
답변 보기
정답: D
질문 #55
한 제조 회사는 머신러닝(ML) 모델을 사용하여 품질 문제를 감지합니다. 이 모델은 각 생산 단계가 끝날 때마다 회사 제품을 촬영한 이미지를 사용합니다. 이 회사는 생산 현장에 평균 초당 한 장의 이미지를 생성하는 수천 대의 기계를 보유하고 있으며, 한 대의 제조 기계로 성공적인 파일럿을 운영했습니다. 파일럿을 위해 머신 러닝 전문가들은 AWS IoT Greengrass를 실행하는 산업용 PC를 사용해 이미지를 Ama에 업로드하는 장기 실행 AWS Lambda 기능을 사용했습니다
A. 프로덕션 사이트와 가장 가까운 AWS 리전 간에 10Gbps AWS 다이렉트 커넥트 연결을 설정합니다
B. 이미지를 압축하고 압축된 파일을 Amazon S3에 업로드하기 위해 AWS IoT Greengrass에서 실행되는 장기 실행 Lambda 함수를 확장합니다
C. 이지메이커에 자동 스케일링을 사용합니다
D. 머신에 설치된 산업용 PC에서 실행되는 AWS IoT Greengrass 코어에 Lambda 함수와 ML 모델을 배포합니다
답변 보기
정답: D
질문 #56
한 회사에서 여러 부서의 데이터 과학자 및 엔지니어가 Amazon SageMaker Studio 도메인에 액세스할 수 있는 메커니즘을 설정하고 있습니다. 각 부서에는 고유한 SageMaker Studio 도메인이 있으며, 회사는 데이터 과학자와 엔지니어가 회사 자격 증명을 사용하여 로그인할 수 있는 중앙 프록시 애플리케이션을 구축하려고 합니다. 프록시 애플리케이션은 회사의 기존 ID 공급자(IdP)를 사용하여 사용자를 인증합니다. 그런 다음 애플리케이션은 사용자를 적절한 SageMaker Studi로 라우팅합니다
A. 세이지메이커 CreatePresignedDomainUrl API를 사용하여 DynamoDB 테이블에 따라 각 도메인에 대해 미리 지정된 URL을 생성합니다
B. 세이지메이커 CreateHuman TaskUi API를 사용하여 UI URL을 생성합니다
C. mazon SageMaker ListHumanTaskUis API를 사용하여 모든 UI URL을 나열합니다
D. 이지메이커 CreatePresignedNotebookInstanceUrl API를 사용해 미리 지정한 URL을 생성합니다
답변 보기
정답: A
질문 #57
한 제조 회사가 머신러닝 전문가에게 결함이 있는 부품을 8가지 결함 유형 중 하나로 분류하는 모델을 개발해 달라고 요청했습니다. 이 회사는 훈련을 위해 결함 유형별로 약 100,000개의 이미지를 제공했습니다. 이미지 분류 모델의 초기 훈련 과정에서 전문가는 검증 정확도가 80%인 반면 훈련 정확도는 90%라는 것을 알아챘습니다. 이러한 유형의 이미지 분류에 대한 인간 수준의 성능은 약 90%로 알려져 있는데, 이 전문가는 무엇을 고려해야 할까요?
A. 긴 교육 시간
B. 네트워크 규모 확대
C. 른 최적화 프로그램 사용
D. 떤 형태의 정규화 사용
답변 보기
정답: D
질문 #58
한 회사에서 머신 러닝(ML) 모델을 설정하고 Amazon SageMaker 호스팅 서비스를 사용하는 엔드포인트를 통해 프로덕션에 배포했습니다. ML 팀은 워크로드 변경을 지원하기 위해 SageMaker 인스턴스에 대한 자동 확장을 구성했습니다. 테스트 중에 팀은 새 인스턴스가 준비되기 전에 추가 인스턴스가 시작되는 것을 발견했습니다. 이 동작을 가능한 한 빨리 변경해야 하는데, ML 팀은 이 문제를 어떻게 해결할 수 있을까요?
A. 스케일인 활동의 재사용 대기 시간을 줄입니다
B. SageMaker를 사용하여 현재 엔드포인트를 다중 모델 엔드포인트로 교체합니다
C. ageMaker 추론 엔드포인트를 트리거하도록 Amazon API 게이트웨이 및 AWS Lambda를 설정합니다
D. 스케일아웃 활동의 재사용 대기 시간을 늘립니다
답변 보기
정답: D
질문 #59
머신 러닝 전문가가 기업 VPC의 사설 서브넷에서 Amazon SageMaker 노트북 인스턴스를 사용하고 있습니다. ML 스페셜리스트는 Amazon SageMaker 노트북 인스턴스의 Amazon EBS 볼륨에 중요한 데이터를 저장하고 있으며 해당 EBS 볼륨의 스냅샷을 만들어야 합니다. 하지만 ML 스페셜리스트가 VPC 내에서 Amazon SageMaker 노트북 인스턴스의 EBS 볼륨 또는 Amazon EC2 인스턴스를 찾을 수 없습니다. ML 스페셜리스트가 VPC에서 인스턴스를 볼 수 없는 이유는 무엇인가요?
A. 아마존 세이지메이커 노트북 인스턴스는 고객 계정 내의 EC2 인스턴스를 기반으로 하지만 VPC 외부에서 실행됩니다
B. Amazon SageMaker 노트북 인스턴스는 고객 계정 내의 Amazon ECS 서비스를 기반으로 합니다
C. mazon SageMaker 노트북 인스턴스는 AWS 서비스 계정 내에서 실행되는 EC2 인스턴스를 기반으로 합니다
D. mazon SageMaker 노트북 인스턴스는 AWS 서비스 계정 내에서 실행되는 AWS ECS 인스턴스를 기반으로 합니다
답변 보기
정답: C
질문 #60
한 데이터 과학자가 Amazon Forecast를 사용하여 소매 회사의 재고 수요 예측 모델을 구축하려고 합니다. 이 회사는 제품에 대한 과거 재고 수요에 대한 데이터 집합을 Amazon S3 버킷에 저장된 .csv 파일로 제공했습니다. 아래 표는 데이터 세트의 샘플을 보여줍니다. 데이터 과학자는 이 데이터를 어떻게 변환해야 할까요?
A. M5 인스턴스에서 모델을 일괄 변환 작업으로 다시 배포합니다
B. M5 인스턴스에서 모델을 재배포합니다
C. 3dn 인스턴스에 모델을 다시 배포합니다
D. 3 인스턴스를 사용하여 모델을 Amazon ECS(Amazon Elastic Container Service) 클러스터에 배포합니다
답변 보기
정답: A
질문 #61
한 회사에서 사용자 행동을 사기 또는 정상으로 분류하고자 합니다. 머신 러닝 전문가가 내부 조사에 따라 계정 연령과 거래 월이라는 두 가지 특징을 기반으로 이진 분류기를 구축하려고 합니다. 이러한 특징에 대한 클래스 분포가 제공된 그림에 나와 있는데, 이 정보를 바탕으로 사기 클래스에 대해 가장 높은 회상률을 보이는 모델은 무엇인가요?
A. 사 결정 트리
B. 형 서포트 벡터 머신(SVM)
C. 이브 베이지안 분류기
D. 시그모이드 활성화 기능이 있는 단일 퍼셉트론
답변 보기
정답: C
질문 #62
한 보험 회사는 카메라를 사용하여 운전자의 행동을 관찰하고 주의가 산만해 보일 때 경고를 보내는 새로운 차량용 장치를 개발하고 있습니다. 이 회사는 머신 러닝 전문가가 머신 러닝 모델을 훈련하고 평가하는 데 사용할 통제된 환경에서 약 10,000개의 훈련 이미지를 만들었습니다. 모델 평가 중에 전문가는 에포크 수가 증가할수록 훈련 오류율이 빠르게 감소하고 모델이 정확하게 추론하지 못하는 것을 발견했습니다
A. SV 파일
B. arquet 파일
C. 축 JSON
D. ecordIO
답변 보기
정답: BE
질문 #63
머신 러닝 전문가가 사기 탐지 팀에 배정되어 테스트 데이터에 적절하게 작동하는 XGBoost 모델을 조정해야 합니다. 그러나 알 수 없는 데이터의 경우 예상대로 작동하지 않습니다. 기존 파라미터는 다음과 같이 제공됩니다. 과적합을 피하기 위해 전문가가 따라야 하는 파라미터 튜닝 지침은 무엇인가요?
A. ax_depth 매개변수 값을 늘립니다
B. 최대 깊이 매개변수 값을 낮춥니다
C. 목표를 binary:logistic으로 업데이트합니다
D. in_child_weight 매개변수 값을 낮춥니다
답변 보기
정답: B
질문 #64
데이터 과학자가 보험 기록 세트를 받았는데, 각 기록은 기록 ID, 200개 범주 중 최종 결과, 최종 결과 날짜로 구성되어 있습니다. 보험금 청구 내용에 대한 일부 정보도 제공되지만 200개 범주 중 일부에 대해서만 제공됩니다. 각 결과 범주에는 지난 3년간 수백 개의 기록이 분포되어 있습니다. 데이터 과학자는 몇 달 전부터 각 카테고리에서 월별로 예상되는 청구 건수를 예측하고자 합니다
A. 청구 내용을 기반으로 200개의 카테고리를 지도 학습을 사용하여 월별로 분류합니다
B. 클레임 ID 및 타임스탬프를 사용한 강화 학습을 통해 상담원이 월별로 예상되는 각 카테고리의 클레임 수를 파악합니다
C. 청구 ID 및 타임스탬프를 사용하여 월별 예상되는 각 카테고리의 청구 건수를 파악하는 예측
D. 클레임 내용에 대한 부분 정보가 제공되는 카테고리에 대한 지도 학습을 통한 분류 및 기타 모든 카테고리에 대한 클레임 ID 및 타임스탬프를 사용한 예측
답변 보기
정답: C
질문 #65
한 데이터 과학자가 금융 거래의 사기 여부를 분류하기 위한 머신 러닝 모델을 개발하고 있습니다. 훈련에 사용할 수 있는 레이블이 지정된 데이터는 비사기 관측치 100,000개와 사기 관측치 1,000개로 구성되어 있으며, 데이터 과학자는 데이터에 XGBoost 알고리즘을 적용하여 훈련된 모델을 이전에 보지 못한 검증 데이터 세트에 적용하면 다음과 같은 혼동 행렬을 얻게 됩니다. 모델의 정확도는 99.1%이지만 데이터 과학자는 오류의 수를 줄여야 합니다
A. n-그램을 사용하도록 전처리를 변경합니다
B. 가장 큰 문장의 단어 수보다 더 많은 노드를 순환 신경망(RNN)에 추가합니다
C. 주의 집중 메커니즘과 관련된 하이퍼파라미터를 조정합니다
D. 른 가중치 초기화 유형을 선택합니다
답변 보기
정답: DE
질문 #66
데이터 과학자는 고용 데이터를 분석해야 합니다. 이 데이터 집합에는 10가지 특징에 걸쳐 사람들에 대한 약 1,000만 개의 관측값이 포함되어 있습니다. 예비 분석 중에 데이터 과학자는 소득과 연령 분포가 정상적이지 않다는 것을 발견합니다. 소득 수준은 예상대로 소득이 높은 사람이 적은 오른쪽 왜곡을 보이지만, 연령 분포는 노동력에 참여하는 나이가 많은 사람이 적은 오른쪽 왜곡을 보입니다. 데이터 과학자가 어떤 기능 변환을 할 수 있을까요?
A. 훈련에 사용되는 미니 배치에서 훈련 데이터의 무작위화를 늘립니다
B. 전체 데이터 중 더 많은 비율을 학습 데이터 세트에 할당합니다
C. 육에 L1 또는 L2 정규화 및 중도 탈락 적용
D. 러닝 네트워크의 레이어와 유닛(또는 뉴런) 수 줄이기
답변 보기
정답: BD
질문 #67
한 머신러닝 전문가가 이미지에서 차량의 제조사와 모델을 식별하는 모델을 훈련하고 있습니다. 이 전문가는 전이 학습과 일반 물체의 이미지로 훈련된 기존 모델을 사용하려고 합니다. 이 전문가는 다양한 차량 제조사와 모델이 포함된 사진의 대규모 사용자 지정 데이터 세트를 수집했는데, 사용자 지정 데이터로 모델을 다시 훈련하려면 어떻게 초기화해야 하나요?
A. 마지막으로 완전히 연결된 레이어를 포함한 모든 레이어에서 무작위 가중치로 모델을 초기화합니다
B. 모든 레이어에서 미리 학습된 가중치로 모델을 초기화하고 마지막으로 완전히 연결된 레이어를 교체합니다
C. 모든 레이어에서 무작위 가중치로 모델을 초기화하고 마지막으로 완전히 연결된 레이어를 교체합니다
D. 마지막으로 완전히 연결된 레이어를 포함한 모든 레이어에서 사전 학습된 가중치로 모델을 초기화합니다
답변 보기
정답: B
질문 #68
한 회사가 웹 광고 클릭에서 머신 러닝(ML) 데이터를 Amazon S3 데이터 레이크에 수집합니다. 클릭 데이터는 KPL(Kinesis Producer Library)을 사용하여 Amazon Kinesis 데이터 스트림에 추가됩니다. 데이터는 Amazon Kinesis 데이터 파이어호스 전송 스트림을 사용하여 데이터 스트림에서 S3 데이터 레이크로 로드됩니다. 데이터 볼륨이 증가함에 따라 ML 전문가는 Amazon S3로 수집되는 데이터의 속도가 비교적 일정하다는 것을 알게 되었습니다. 또한 Kinesis 데이터 스트림에 대한 데이터 백로그가 증가하고 있습니다
A. 쓰기할 배달 스트림의 S3 접두사 수를 늘립니다
B. 데이터 스트림의 보존 기간을 줄입니다
C. 데이터 스트림의 샤드 수를 늘립니다
D. 네시스 클라이언트 라이브러리(KCL)를 사용하는 더 많은 소비자를 추가합니다
답변 보기
정답: C
질문 #69
로펌에서는 매일 수천 건의 계약을 처리합니다. 모든 계약서에 서명을 해야 합니다. 현재 변호사가 모든 계약서에 서명이 있는지 수동으로 확인하고 있으며, 로펌은 각 계약서의 서명 감지를 자동화하기 위해 머신러닝(ML) 솔루션을 개발 중입니다. ML 솔루션은 각 계약 페이지에 대한 신뢰 점수도 제공해야 하는데, 로펌에서 각 계약 페이지의 신뢰 점수를 생성하는 데 사용할 수 있는 Amazon Textract API 작업은 무엇인가요?
A. AnalyzeDocument API 작업을 사용합니다
B. 문서에서 예측 API 호출을 사용합니다
C. tartDocumentAnalysis API 액션을 사용하여 서명을 감지합니다
D. etDocumentAnalysis API 액션을 사용하여 서명을 감지합니다
답변 보기
정답: A
질문 #70
한 머신 러닝 전문가가 Amazon SageMaker를 위한 확장 가능한 데이터 스토리지 솔루션을 설계하고 있습니다. 현재 TFRecords로 저장된 정적 학습 데이터에 의존하는 train.py 스크립트로 구현된 기존 TensorFlow 기반 모델이 있는데, Amazon SageMaker에 학습 데이터를 제공하는 방법 중 개발 오버헤드가 가장 적으면서 비즈니스 요구 사항을 충족하는 방법은 무엇인가요?
A. Amazon SageMaker 스크립트 모드를 사용하고 train
B. 아마존 세이지메이커 스크립트 모드를 사용하고 train
C. rain
D. Amazon SageMaker에서 허용하는 형식으로 데이터를 준비합니다
답변 보기
정답: B
질문 #71
이 그래프는 신경망의 에포크에 대한 훈련 및 검증 손실을 보여줍니다.훈련 중인 네트워크는 다음과 같습니다.-두 개의 고밀도 계층, 하나의 출력 뉴런-각 계층에 뉴런 100개-가중치의 무작위 초기화검증 집합의 정확도 측면에서 모델 성능을 개선하기 위해 어떤 기술을 사용할 수 있습니까?
A. 선형 회귀는 부적절합니다
B. 선형 회귀는 부적절합니다
C. 선형 회귀가 적절합니다
D. 선형 회귀가 적절합니다
답변 보기
정답: A
질문 #72
머신 러닝 파이프라인을 통해 처리되는 모든 고객 방문에 대한 분석을 실행하고자 하는 온라인 소매업체에서 머신 러닝 전문가가 일하고 있습니다. 이 데이터는 초당 최대 100개의 트랜잭션으로 Amazon Kinesis 데이터 스트림에서 수집해야 하며 JSON 데이터 블롭의 크기는 100KB입니다. 이 데이터를 성공적으로 수집하기 위해 전문가가 사용해야 하는 Kinesis 데이터 스트림의 최소 샤드 수는 얼마인가요?
A. 샤드
B. 0 샤드
C. 00 샤드
D. ,000 파편
답변 보기
정답: B
질문 #73
한 모바일 네트워크 사업자가 Amazon Athena와 Amazon S3를 사용하여 회사의 운영을 분석하고 최적화하기 위한 분석 플랫폼을 구축하고 있으며, 소스 시스템은 .CSV 형식으로 데이터를 실시간으로 전송합니다. 데이터 엔지니어링 팀은 Amazon S3에 저장하기 전에 데이터를 Apache Parquet 형식으로 변환하려고 하는데, 구현하는 데 가장 적은 노력이 드는 솔루션은 무엇인가요?
A. mazon EC2 인스턴스에서 Apache Kafka Streams를 사용하여
B. mazon Kinesis 데이터 스트림에서
C. mazon EMR 클러스터에서 Apache Spark Structured Streaming을 사용하여
Amazon Kinesis 데이터 스트림에서 . SV 데이터를 수집하고 Amazon Kinesis 데이터 파이어호스를 사용하여 데이터를 Parquet으로 변환합니다
답변 보기
정답: B
질문 #74
한 도서관에서 아마존 레코그니션을 사용하는 자동 도서 대출 시스템을 개발 중입니다. 도서관 회원의 얼굴 이미지는 Amazon S3 버킷에 저장됩니다. 회원들이 책을 빌릴 때 Amazon Rekognition CompareFaces API 작업은 실제 얼굴과 Amazon S3에 저장된 얼굴을 비교하며, 도서관은 저장된 이미지가 암호화되어 있는지 확인하여 보안을 강화해야 합니다. 또한 이미지가 Amazon Rekognition과 함께 사용되는 경우 전송 중에도 이미지를 암호화해야 합니다. 라이브러리는 또한
A. S3 버킷에서 서버 측 암호화를 활성화합니다
B. 이미지를 저장하기 위해 Amazon Rekognition 컬렉션을 사용하도록 전환합니다
C. 이미지를 저장하고 얼굴을 비교하기 위해 Amazon S3용 AWS GovCloud(미국) 리전을 사용하도록 전환합니다
D. S3 버킷에서 클라이언트 측 암호화를 활성화합니다
답변 보기
정답: A
질문 #75
한 물류 회사는 10개 창고에 있는 단일 품목의 다음 달 재고 요구량을 예측하기 위한 예측 모델이 필요합니다. 머신 러닝 전문가가 Amazon Forecast를 사용하여 3년간의 월별 데이터로 예측 모델을 개발합니다. 누락된 데이터는 없습니다. 이 전문가는 예측자를 훈련하기 위해 DeepAR+ 알고리즘을 선택하고, 예측자의 절대 오차율(MAPE)이 현재 인간 예측자가 생성한 MAPE보다 훨씬 더 크다는 것을 의미하며, CreatePredictor API 호출을 변경하면 개선될 수 있습니다
A. AWS Glue의 ETL 작업을 사용하여 데이터 집합을 대상 시계열 데이터 집합과 항목 메타데이터 데이터 집합으로 분리합니다
B. Amazon SageMaker의 Jupyter 노트북을 사용하여 데이터 집합을 관련 시계열 데이터 집합과 항목 메타데이터 데이터 집합으로 분리합니다
C. AWS 배치 작업을 사용하여 데이터 집합을 대상 시계열 데이터 집합, 관련 시계열 데이터 집합 및 항목 메타데이터 데이터 집합으로 분리합니다
D. Amazon SageMaker의 Jupyter 노트북을 사용하여 데이터를 최적화된 protobuf recordIO 형식으로 변환합니다
답변 보기
정답: AD
질문 #76
회사에서 Amazon SageMaker 환경을 설정하고 있습니다. 회사 데이터 보안 정책에 따라 인터넷을 통한 통신이 허용되지 않습니다. Amazon SageMaker 노트북 인스턴스에 대한 직접 인터넷 액세스를 활성화하지 않고 Amazon SageMaker 서비스를 사용하려면 어떻게 해야 하나요?
A. 회사 VPC 내에 NAT 게이트웨이를 만듭니다
B. 온프레미스 네트워크를 통해 Amazon SageMaker 트래픽을 라우팅합니다
C. 업 VP 내에 Amazon SageMaker VPC 인터페이스 엔드포인트 만들기
D. 마존 세이지메이커를 호스팅하는 아마존 VPC로 VPC 피어링을 생성합니다
답변 보기
정답: C

제출 후 답변 보기

질문에 대한 답변을 얻으려면 이메일과 WhatsApp을 제출하세요.

참고: 올바른 시험 결과를 얻을 수 있도록 이메일 ID와 Whatsapp이 유효한지 확인하십시오.

이메일:
WhatsApp/전화번호: