不想錯過任何事?

通過認證考試的技巧

最新考試新聞和折扣資訊

由我們的專家策劃和更新

是的,請向我發送時事通訊

2024 次更新的 MLS-C01 考試問題和練習測試,AWS Certified Machine Learning | SPOTO

使用 SPOTO 更新的練習測試和考試問題,爲成功通過 2024 年 MLS-C01 考試做好準備。AWS Certified Machine Learning-Specialty (MLS-C01) 認證專爲開發或數據科學領域的專業人士量身定製,旨在驗證他們在 AWS Cloud 上構建、培訓、微調和部署機器學習模型的技能。掌握考試問題和答案,展示利用 AWS 服務開發 ML 應用程序的能力。利用練習測試和考試轉儲來全面準備和評估您的知識。訪問免費考試材料和考試模擬器,以加強考試練習和準備。SPOTO 提供一系列資源,包括示例問題和模擬考試,以幫助您在 MLS-C01 考試中取得優異成績,並在充滿活力的機器學習領域推動您的職業發展。在 SPOTO 的支持下,充滿信心地備考並實現您的認證目標。
參加其他線上考試

問題 #1
一位機器學習專家使用 AmazonSageMaker 啓動了基於樹的集合模型的超參數調整工作,並將 ROC 曲線下面積 (AUC) 作爲目標指標。該工作流最終將部署在一條每天晚上重新訓練和調整超參數的流水線中,以便對每 24 小時就會過時的數據的點擊率進行建模。爲了減少訓練這些模型所需的時間,並最終降低成本,該專家希望重新配置輸入超參數。
A. 方圖顯示最重要的輸入特徵是否爲高斯特徵。
B. 用 t 分布隨機鄰域嵌入(t-SNE)技術,將大量輸入變量以更易於閱讀的維度可視化,並按目標變量對點進行着色的散點圖。
C. 點圖顯示了目標指標在每次訓練迭代中的表現。
D. 示最大樹深與客觀指標之間相關性的散點圖。
查看答案
正確答案: B
問題 #2
一家房地產公司正在推出一款預測新房價格的新產品。房產和價格的歷史數據以 .csv 格式存儲在亞馬遜 S3 存儲桶中。數據有一個標題、一些分類字段和一些缺失值。公司的數據科學家使用 Python 和一個常用的開源庫將缺失值填充爲零。數據科學家刪除了所有分類字段,並使用開源線性回歸算法訓練了一個模型。
A. Amazon Elastic Container Service (Amazon ECS) 創建一個可訪問 S3 桶的服務鏈接角色。創建基於 AWS 深度學習容器映像的 ECS 集羣。編寫代碼以執行特徵工程。訓練用於預測價格的邏輯回歸模型,並將其指向包含數據集的存儲桶。等待訓練工作完成。執行推論。
B. 建 Amazon SageMaker 筆記本,並創建與筆記本關聯的新 IAM 角色。從 S3 數據桶中提取數據集。探索特徵工程轉換、回歸算法和超參數的不同組合。比較筆記本中的所有結果,並將最準確的配置部署到端點中進行預測。
C. 建可訪問 Amazon S3、Amazon SageMaker 和 AWS Lambda 的 IAM 角色。使用 SageMaker 內置 XGBoost 模型創建一個訓練作業,指向包含數據集的數據桶。指定價格爲目標特徵。等待作業完成。將模型工件加載到 Lambda 函數中,以推斷新房價格。
D. Amazon SageMaker 創建可訪問 S3 存儲桶的 IAM 角色。使用 SageMaker Autopilot 創建一個 SageMaker AutoML 作業,指向包含數據集的存儲桶。將價格指定爲目標屬性。等待作業完成。部署最佳預測模型。
查看答案
正確答案: A
問題 #3
一位數據科學家正在使用亞馬遜 SageMaker 內置的 BlazingText 算法訓練一個文本分類模型。數據集中有 5 個類別,A 類有 300 個樣本,B 類有 292 個樣本,C 類有 240 個樣本,D 類有 258 個樣本,E 類有 310 個樣本。訓練模型後,數據科學家生成了訓練集和測試集的混淆矩陣。
A. 類和 D 類過於相似。
B. 據集太小,無法進行保留交叉驗證。
C. 據分布偏斜。
D. 型對 B 類和 E 類過度擬合。
查看答案
正確答案: B
問題 #4
一位機器學習專家在對一個模型進行實驗時發現了以下統計數據。專家能從實驗中發現什麼?
A. 驗 1 中的模型有較高的方差誤差,實驗 3 中通過正則化減少了這一誤差 實驗 2 表明實驗 1 中的偏差誤差最小
B. 驗 1 中的模型偏差誤差較大,而在實驗 3 中通過正則化降低了偏差誤差 實驗 2 表明實驗 1 中的方差誤差最小
C. 驗 1 中的模型存在高偏差誤差和高方差誤差,在實驗 3 中通過正則化降低了這些誤差 實驗 2 表明,不能通過增加模型的層數和神經元來降低高偏差誤差
D. 驗 1 中的模型有很高的隨機噪聲誤差,在實驗 3 中通過正則化降低了這一誤差 實驗 2 表明,隨機噪聲不能通過增加模型的層數和神經元來降低
查看答案
正確答案: C
問題 #5
一家公司希望根據現有的歷史銷售數據預測房屋的銷售價格。該公司數據集中的目標變量是銷售價格。特徵包括地塊大小、居住面積測量值、非居住面積測量值、臥室數量、浴室數量、建造年份和郵政編碼等參數。該公司希望使用多變量線性回歸來預測房屋銷售價格。
A. 製特徵直方圖並計算其標準偏差。刪除方差較大的特徵。
B. 製特徵直方圖並計算其標準偏差。刪除方差小的特徵。
C. 製熱圖,顯示數據集與自身的相關性。刪除相互相關性得分較低的特徵。
D. 所有特徵與目標變量進行相關性檢查。刪除目標變量相關性得分較低的特徵。
查看答案
正確答案: D
問題 #6
某公司希望將用戶行爲分爲欺詐行爲和正常行爲。根據內部研究,機器學習專家希望基於賬戶年齡和交易月份這兩個特徵建立一個二元分類器。根據這些信息,哪個模型對欺詐類的召回率最高?
A. 策樹
B. 性支持向量機(SVM)
C. aive Bayesian 分類器
D. 有西格碼激活函數的單感知器
查看答案
正確答案: C
問題 #7
一家製造公司使用機器學習(ML)模型來檢測質量問題。這些模型使用的是公司產品在每個生產步驟結束時拍攝的圖像。該公司在生產現場有數千臺機器,平均每秒生成一張圖像。在試點中,ML 專家使用了一臺運行 AWS IoT Greengrass 的工業 PC,該 PC 帶有一個長期運行的 AWS Lambda 函數,可將圖像上傳到亞馬遜的亞馬遜雲平臺。
A. 生產站點和最近的 AWS 區域之間建立 10 Gbps 的 AWS Direct Connect 連接。使用直接連接連接上傳圖像。增加 SageMaker 端點使用的實例大小和實例數量。
B. 展在 AWS IoT Greengrass 上運行的長期 Lambda 函數,以壓縮圖像並將壓縮文件上傳到亞馬遜 S3。使用單獨的 Lambda 函數解壓文件,該函數調用現有的 Lambda 函數來運行推理管道。
C. SageMaker 使用自動擴展。在生產站點和最近的 AWS 區域之間建立 AWS Direct Connect 連接。使用直接連接連接上傳圖像。
D. Lambda 函數和 ML 模型部署到 AWS IoT Greengrass 核心上,該核心在安裝在每臺機器上的工業 PC 上運行。擴展在 AWS IoT Greengrass 上長期運行的 Lambda 函數,利用捕獲的圖像調用 Lambda 函數,並在直接將結果轉發到網絡服務的邊緣組件上運行推理。
查看答案
正確答案: D
問題 #8
一位機器學習專家建立了一個圖像分類深度學習模型。然而,專家遇到了過擬合問題,訓練和測試的準確率分別爲 99% 和 75%。專家應該如何解決這個問題,其背後的原因是什麼?
A. 該提高學習率,因爲優化過程陷入了局部最小值。
B. 平層的輟學率應該提高,因爲模型不夠概括。
C. 於模型不夠複雜,應增加扁平層旁邊的緻密層的維度。
D. 於優化過程在達到全局最小值之前就已終止,因此應增加歷時次數。
查看答案
正確答案: D
問題 #9
一家零售公司正在通過全球在線市場銷售產品。該公司希望使用機器學習(ML)來分析客戶反饋,並確定需要改進的具體領域。一名開發人員構建了一個工具,從在線市場收集客戶評論,並將其存儲到亞馬遜 S3 存儲桶中。建立 ML 模型的數據科學家必須確定其他數據源,以增加數據集的規模。
A. 戶與公司客戶服務人員交換的電子郵件
B. 交媒體上包含公司名稱或產品名稱的帖子
C. 公開獲取的新聞報道集
D. 開收集的客戶評價
E. 司產品銷售收入數字
F. 司產品說明書
查看答案
正確答案: BDF
問題 #10
數據科學家需要爲高速、實時的流數據創建一個無服務器攝取和分析解決方案。攝取流程必須緩衝傳入記錄,並將其從 JSON 轉換爲查詢優化的列格式,且不會丟失數據。輸出數據存儲必須高度可用,分析師必須能夠針對數據運行 SQL 查詢並連接到現有的商業智能儀錶板。數據科學家應該構建哪種解決方案來滿足要求?
A. AWS Glue 數據目錄中創建傳入數據形式的模式
B. 用 Amazon Kinesis Data Firehose 交付流來流式傳輸數據,並在將數據交付到 Amazon S3 之前使用 AWS Glue 數據目錄將數據轉換爲 Apache Parquet 或 ORC 格式。讓分析師使用 Amazon Athena 直接從 Amazon S3 查詢數據,並使用 Athena Java Database Connectivity (JDBC) 連接器連接到 Bl 工具。
C. 每條 JSON 記錄寫入 Amazon S3 中的暫存位置。使用 S3 Put 事件觸發 AWS Lambda 函數,將數據轉換爲 Apache Parquet 或 ORC 格式,並將數據寫入 Amazon S3 中的處理數據位置。讓分析師使用 Amazon Athena 直接從 Amazon S3 查詢數據,並使用 Athena Java Database Connectivity (JDBC) 連接器連接到 Bl 工具。
D. 每條 JSON 記錄寫入 Amazon S3 中的暫存位置。使用 S3 Put 事件觸發 AWS Lambda 函數,將數據轉換爲 Apache Parquet 或 ORC 格式,並插入 Amazon RDS PostgreSQL 數據庫。
E. 分析師從 RDS 數據庫中查詢和運行儀錶盤。
F. 用 Amazon Kinesis Data Analytics 接收流數據,並執行實時 SQL 查詢,將記錄轉換爲 Apache Parquet,然後再傳輸到 Amazon S3。讓分析師使用 Amazon Athena 直接從 Amazon S3 查詢數據,並使用 Athena Java Database Connectivity (JDBC) 連接器連接 Bl 工具。
查看答案
正確答案: C
問題 #11
一位數據科學家正在開發一種二元分類器,用於根據一系列測試結果預測患者是否患有某種疾病。數據科學家擁有從人羣中隨機抽取的 400 名患者的數據。數據科學家應該採用哪種交叉驗證策略?
A. =5 的 k 倍交叉驗證策略
B. =5 的分層 k 倍交叉驗證策略
C. =5 和 3 次重複的 k 倍交叉驗證策略
D. 練和驗證的分層比例爲 80/20
查看答案
正確答案: B
問題 #12
一家對安全問題非常敏感的公司的機器學習專家正在爲模型訓練準備一個數據集。該數據集存儲在 Amazon S3 中,包含個人身份信息 (Pll)。該數據集 * 必須只能從 VPC 訪問。 * 不得穿越公共互聯網。如何滿足這些要求?
A. 建一個 VPC 端點,並應用限制訪問給定 VPC 端點和 VPC 的桶訪問策略。
B. 建一個 VPC 端點,並應用允許從給定的 VPC 端點和 Amazon EC2 實例進行訪問的桶訪問策略。
C. 建一個 VPC 端點,並使用網絡訪問控制列表 (NACL) 僅允許給定的 VPC 端點和 Amazon EC2 實例之間的流量。
D. 建一個 VPC 端點,並使用安全組限制對給定 VPC 端點和 Amazon EC2 實例的訪問。
查看答案
正確答案: B
問題 #13
在針對分類問題對神經網絡進行迷你批量訓練期間,數據科學家注意到訓練精度出現了波動,造成這一問題的最可能原因是什麼?
A. 據集中的類別分布不平衡
B. 據集洗牌被禁用
C. 量太大
D. 習率非常高
查看答案
正確答案: C
問題 #14
某公司希望將用戶行爲分爲欺詐行爲和正常行爲。根據內部研究,機器學習專家將根據兩個特徵建立二元分類器:賬戶年齡(用 x 表示)和交易月份(用 y 表示)。哪個模型的準確率最高?
A. 性支持向量機(SVM)
B. 策樹
C. 有徑向基函數核的支持向量機(SVM)
D. 有 Tanh 激活函數的單感知器
查看答案
正確答案: C
問題 #15
機器學習專家必須建立一個流程,使用 Amazon Athena 在 Amazon S3 上查詢一個數據集。數據集包含 800,000 多條以明文 CSV 文件格式存儲的記錄。每條記錄包含 200 列,大小約爲 1.5 MB。機器學習專家應該如何轉換數據集,以儘量縮短查詢運行時間?
A. 記錄轉換爲 Apache Parquet 格式。
B. 記錄轉換爲 JSON 格式。
C. 記錄轉換爲 GZIP CSV 格式。
D. 記錄轉換爲 XML 格式
查看答案
正確答案: A
問題 #16
一位機器學習專家需要預測未來 2 天該城市的空氣質量(以污染物的百萬分之一爲單位),因爲這是一個原型,所以只有去年的每日數據。
A. 由全年數據組成的單一時間序列上使用 Amazon SageMaker k-Nearest-Neighbors (kNN) 算法,預測因子類型爲回歸因子。
B. 包含全年數據的單一時間序列上使用 Amazon SageMaker 隨機剪切森林 (RCF)。
C. 由全年數據組成的單一時間序列上使用 Amazon SageMaker 線性學習器算法,並使用回歸器預測器類型。
D. 包含全年數據的單一時間序列上使用 Amazon SageMaker 線性學習算法,並使用預測器類型的分類器。
查看答案
正確答案: A
問題 #17
一家遊戲公司推出了一款在線遊戲,人們可以免費開始遊戲,但如果他們選擇使用某些功能,就需要付費。該公司需要建立一個自動系統來預測新用戶是否會在一年內成爲付費用戶。訓練數據集包括 1000 個正樣本(來自在 1 年內最終付費的用戶)和 99.9 萬個負樣本(來自未使用任何付費功能的用戶)。E
A. 隨機森林添加更多深度樹,讓模型學習更多特徵。
B. 訓練數據集中包含一份測試數據集中的樣本。
C. 過複製正樣本並在複製數據中添加少量噪音,生成更多的正樣本。
D. 改成本函數,使假陰性比假陽性對成本值的影響更大。
E. 改成本函數,使誤報對成本值的影響高於誤報。
查看答案
正確答案: CD
問題 #18
一名機器學習專家被分配了一個使用 Amazon SageMaker 進行培訓的 TensorFlow 項目,需要在沒有 Wi-Fi 接入的情況下繼續工作很長時間。該專家應使用哪種方法繼續工作?
A. 筆記本電腦上安裝 Python 3 和 boto3,並使用該環境繼續開發代碼。
B. GitHub 下載 Amazon SageMaker 使用的 TensorFlow Docker 容器到本地環境,並使用 Amazon SageMaker Python SDK 測試代碼。
C. tensorflow
D. SageMaker 筆記本下載到本地環境,然後在筆記本電腦上安裝 Jupyter 筆記本,並在本地筆記本中繼續開發。
查看答案
正確答案: B
問題 #19
機器學習專家正在創建一個新的自然語言處理應用程序,用於處理由 100 萬個句子組成的數據集,其目的是運行 Word2Vec 來生成句子的嵌入,並進行不同類型的預測。
A. 行語篇標記,只保留動作動詞和名詞
B. 所有單詞歸一化,使句子小寫
C. 用英語停滯詞詞典刪除停滯詞。
D. "quck "改爲 "quick"。
E. 句子中的所有單詞進行一熱編碼
F. 句子標記爲單詞。
查看答案
正確答案: D
問題 #20
一位機器學習專家正在決定爲分類問題建立一個天真的貝葉斯模型還是一個完整的貝葉斯網絡。專家計算了每個特徵之間的皮爾遜相關係數,發現它們的絕對值在 0.1 到 0.95 之間。
A. 真貝葉斯模型,因爲特徵都是條件獨立的。
B. 全貝葉斯網絡,因爲特徵都是條件獨立的。
C. 真貝葉斯模型,因爲某些特徵具有統計依賴性。
D. 個完整的貝葉斯網絡,因爲某些特徵是統計依賴的。
查看答案
正確答案: C
問題 #21
一家公司希望加強對其機器學習(ML)系統的審計。審計系統必須能夠對 ML 模型使用的功能進行元數據分析。審計解決方案必須生成分析元數據的報告。該解決方案還必須能夠設置數據敏感性和特徵的作者。哪種解決方案能以最少的開發工作量滿足這些要求?能以最少的開發工作量滿足要求的解決方案是使用 Amazon SageM
A. 使用 Amazon SageMaker Feature Store 選擇特徵。創建一個數據流來執行特徵級元數據分析。創建一個 Amazon DynamoDB 表來存儲特徵級元數據。使用 Amazon QuickSight 分析元數據。
B. 使用 Amazon SageMaker Feature Store 爲 ML 模型使用的當前特徵設置特徵組。爲每個特徵分配所需的元數據。使用 SageMaker Studio 分析元數據。
C. 用 Amazon SageMaker 特徵存儲應用自定義算法來分析公司所需的特徵級元數據。創建一個 Amazon DynamoDB 表來存儲特徵級元數據。使用 Amazon QuickSight 分析元數據。
D. 用 Amazon SageMaker 特徵存儲爲 ML 模型使用的當前特徵設置特徵組。爲每個特徵分配所需的元數據。使用 Amazon QuickSight 分析元數據。
查看答案
正確答案: D
問題 #22
使用內置算法之一提交 Amazon SageMaker 培訓作業時,必須指定哪些常用參數?(選擇三個)。
A. 別 Amazon S3 存儲桶中訓練數據位置的訓練通道。
B. 證通道可識別 Amazon S3 存儲桶中驗證數據的位置。
C. mazon SageMaker 可以代表用戶執行任務的 IAM 角色。
D. 使用算法的 JSON 數組中的超參數。
E. 馬遜 EC2 實例類別,指定使用 CPU 還是 GPU 運行訓練。
F. 出路徑,指定訓練好的模型將存放在亞馬遜 S3 存儲桶的哪個位置。
查看答案
正確答案: AEF
問題 #23
數據科學家需要爲高速實時流數據創建一個無服務器攝取和分析解決方案。攝取流程必須緩衝傳入的記錄,並將其從 JSON 轉換爲查詢優化的列格式,且不會丟失數據。輸出數據存儲必須高度可用,分析師必須能夠針對數據運行 SQL 查詢並連接到現有的商業智能儀錶板。
A. AWS Glue 數據目錄中創建傳入數據格式的模式。使用 Amazon Kinesis Data Firehose 交付流來流式傳輸數據,並在將數據交付到 Amazon S3 之前使用 AWS Glue 數據目錄將數據轉換爲 Apache Parquet 或 ORC 格式。讓分析師使用 Amazon Athena 直接從 Amazon S3 查詢數據,並使用 Athena Java Database Connectivity (JDBC) 連接器連接到 BI 工具。
B. 每條 JSON 記錄寫入 Amazon S3 中的暫存位置。使用 S3 Put 事件觸發 AWS Lambda 函數,將數據轉換爲 Apache Parquet 或 ORC 格式,並將數據寫入 Amazon S3 中的處理數據位置。讓分析師使用 Amazon Athena 直接從 Amazon S3 查詢數據,並使用 Athena Java Database Connectivity (JDBC) 連接器連接到 BI 工具。
C. 每條 JSON 記錄寫入 Amazon S3 的暫存位置。使用 S3 Put 事件觸發 AWS Lambda 函數,將數據轉換爲 Apache Parquet 或 ORC 格式,並將其插入 Amazon RDS PostgreSQL 數據庫。讓分析師從 RDS 數據庫中查詢和運行儀錶盤。
D. 用 Amazon Kinesis Data Analytics 來攝取流數據,並執行實時 SQL 查詢將記錄轉換爲 Apache Parquet,然後再傳輸到 Amazon S3。讓分析師使用 Amazon Athena 直接從 Amazon S3 查詢數據,並使用 Athena Java Database Connectivity (JDBC) 連接器連接到 BI 工具。
查看答案
正確答案: A
問題 #24
一位機器學習專家將物聯網土壤傳感器數據存儲在亞馬遜 DynamoDB 表中,並將天氣事件數據作爲 JSON 文件存儲在亞馬遜 S3 中。DynamoDB 中的數據集大小爲 10 GB,Amazon S3 中的數據集大小爲 5 GB。專家希望使用 Amazon SageMaker 在這些數據上訓練一個模型,以幫助預測土壤溼度水平與天氣事件的關係。哪種解決方案能以最少的管理開銷完成訓練 Amazon SageMaker 模型所需的轉換?
A. 動 Amazon EMR 集羣。爲 DynamoDB 表和 S3 數據創建 Apache Hive 外部表。連接 Hive 表並將結果寫入 Amazon S3。
B. 用 AWS Glue 爬蟲抓取數據。編寫一個 AWS Glue ETL 作業,合併兩個表並將輸出寫入 Amazon Redshift 集羣。
C. 傳感器表上啓用 Amazon DynamoDB 流。編寫一個 AWS Lambda 函數,消耗流並將結果附加到 Amazon S3 中的現有天氣文件。
D. 用 AWS Glue 爬蟲抓取數據。編寫一個 AWS Glue ETL 作業,合併兩個表並將 CSV 格式的輸出寫入 Amazon S3。
查看答案
正確答案: C
問題 #25
一位機器學習專家使用 Amazon SageMaker 啓動了一個基於樹的集合模型的超參數調整工作,目標指標是 ROC 曲線下面積(AUC)。
A. 方圖顯示最重要的輸入特徵是否爲高斯特徵。
B. 用分布式隨機鄰域嵌入(I-SNE)將大量輸入變量以更易於閱讀的維度可視化的點按目標變量着色的散點圖。
C. 點圖顯示了目標指標在每次訓練迭代中的表現
D. 示最大樹深與客觀指標之間相關性的散點圖。
查看答案
正確答案: B

提交後看答案

請提交您的電子郵件和WhatsApp以獲取問題的答案。

注意:請確保您的電子郵件 ID 和 Whatsapp 有效,以便您獲得正確的考試結果。

電子郵件:
WhatsApp/電話號碼: