不想錯過任何事?

通過認證考試的技巧

最新考試新聞和折扣資訊

由我們的專家策劃和更新

是的,請向我發送時事通訊

有效備考 AWS MLS-C01 考試問題|AWS 認證開發人員 - 準會員

準備 AWS Certified Machine Learning - Specialty (MLS-C01) 考試需要採取全面的方法。最有效的備考方法之一就是利用高質量的考試試題和答案、測試題和模擬考試。這些資源不僅能幫助您評估自己的知識水平,還能爲您提供有關考試形式和問題類型的寶貴見解。 像 SPOTO 這樣信譽良好的供應商提供各種學習材料,包括考試試題、備考指南和模擬測試。這些資源由學科專家精心製作,並根據最新的考試目標不斷更新。有了這些學習輔助材料,您就可以找出自己的優勢和劣勢,從而將精力集中在需要改進的方面。此外,SPOTO 的模擬考試可模擬實際考試環境,幫助您建立信心,熟悉時間限制和出題形式。通過利用這些考試資源並勤加練習,您可以增加首次成功通過 AWS Certified Machine Learning - Specialty 認證考試的機會。
參加其他線上考試

問題 #1
一家經營在線圖書館的公司正在使用 Amazon Lex 實現一個聊天機器人,以根據類別提供圖書推薦。這個意圖由一個 AWS Lambda 函數來實現,該函數會在給定特定類別的情況下查詢亞馬遜 DynamoDB 表,以獲取書名列表。爲便於測試,自定義插槽類型僅有三個類別:"機器學習 (ML) 專家注意到,有時該請求無法滿足,因爲 Amazon Lex ca
A. 將枚舉值列表中無法識別的單詞作爲新值添加到槽類型中。
B. 建一個新的自定義插槽類型,將未識別的單詞作爲枚舉值添加到該插槽類型中,並將該插槽類型用於插槽。
C. 用 AMAZON
D. 在自定義插槽類型中將未識別的單詞添加爲同義詞。
查看答案
正確答案: D
問題 #2
一家醫學影像公司希望訓練一個計算機視覺模型,以檢測患者 CT 掃描圖像上的可疑區域。該公司擁有大量未標記的 CT 掃描圖像,這些掃描圖像與每位患者相關聯,並存儲在亞馬遜 S3 存儲桶中。只有授權用戶才能訪問這些掃描結果。機器學習工程師需要建立一個標籤管道。該工程師應採取哪一組步驟,以最少的工作量建立標籤管道?
A. 置 Amazon Textract,將低置信度預測路由到 Amazon SageMaker Ground Truth。在執行業務驗證之前,對這些單詞進行人工審核。
B. 使用 Amazon Textract 同步操作而非異步操作。
C. 置 Amazon Textract,將低置信度預測路由到 Amazon Augmented AI (Amazon A2I)。在執行業務驗證之前,對這些單詞進行人工審核。
D. 使用 Amazon Rekognition 檢測圖像中文本的功能,從掃描圖像中提取數據。利用這些信息處理貸款申請。
查看答案
正確答案: C
問題 #3
機器學習專家接收到一家在線購物網站的客戶數據。這些數據包括人口統計、以往訪問和地區信息。專家必須開發一種機器學習方法,以識別客戶的購物模式、偏好和趨勢,從而改進網站,提供更好的服務和智能推薦。
A. 對給定的離散數據集合進行潛在德裏希勒分配(LDA),以識別客戶數據庫中的模式。
B. 一個至少有三層和隨機初始權重的神經網絡,用於識別客戶數據庫中的模式。
C. 基於用戶互動和相關性的協同過濾,以識別客戶數據庫中的模式。
D. 隨機子樣本上的隨機切割森林(RCF),以識別客戶數據庫中的模式。
查看答案
正確答案: C
問題 #4
一家通過提供雲連接設備促進健康睡眠模式的公司目前在 AWS 上託管了一個睡眠跟蹤應用程序。該應用程序收集設備用戶的設備使用信息。公司的數據科學團隊正在構建一個機器學習模型,以預測用戶是否以及何時會停止使用公司的設備。該模型的預測結果將被下遊應用程序使用,以確定聯繫用戶的最佳方式。
A. 在 Amazon SageMaker 中構建並託管多個模型。創建多個 Amazon SageMaker 端點,每個模型一個。在應用層以編程方式控制調用不同模型進行推理。
B. 在 Amazon SageMaker 中構建並託管多個模型。創建具有多個生產變體的 Amazon SageMaker 端點配置。通過更新端點配置,以編程方式控制由多個模型提供的推論部分。
C. 在 Amazon SageMaker Neo 中建立並託管多個模型,以考慮到不同類型的醫療設備。根據醫療設備類型,以編程方式控制調用哪個模型進行推理。
D. 在 Amazon SageMaker 中構建並託管多個模型。創建可訪問多個模型的單個端點。使用 Amazon SageMaker 批次轉換來控制通過單個端點調用不同的模型。
查看答案
正確答案: D
問題 #5
機器學習專家需要移動和轉換數據,爲訓練做準備。其中一些數據需要近乎實時地處理,其他數據可以每小時移動一次。現有的 Amazon EMR MapReduce 作業需要對數據進行清理和特徵工程處理。以下哪些服務可以向 MapReduce 作業提供數據?
A. 使用推理代碼構建 Docker 鏡像。用註冊表主機名標記 Docker 鏡像,並將其上傳到亞馬遜 ECR。
B. 序列化訓練有素的模型,使其格式經過壓縮,以便部署。用註冊表主機名標記 Docker 映像,並將其上傳到 Amazon S3。
C. 列化訓練有素的模型,以便壓縮部署格式。構建鏡像並上傳到 Docker Hub。
D. 使用推理代碼構建 Docker 映像。配置 Docker Hub 並將映像上傳到 Amazon ECR。
查看答案
正確答案: BC
問題 #6
一位機器學習專家繪製了下圖,顯示 k = [1...10] 時的 k-means 結果:考慮到該圖,最佳 k 值的合理選擇是什麼?
A.
B.
C.
D. 0
查看答案
正確答案: B
問題 #7
某公司在公共網站上銷售數千種產品,希望自動識別存在潛在耐用性問題的產品。該公司有 1.000 條帶有日期、星級、評論文本、評論摘要和客戶電子郵件字段的評論,但許多評論都不完整,而且都是空字段。機器學習專家必須訓練一個模型來識別對產品耐用性表示擔憂的評論。第一個模型需要
A. 使用 Amazon Comprehend 訓練自定義分類器。
B. 使用 Gluon 和 Apache MXNet 在 Amazon SageMaker 中構建循環神經網絡 (RNN)。
C. 在 Amazon SageMaker 中使用 Word2Vec 模式訓練內置 BlazingText 模型。
D. 用 Amazon SageMaker 中的內置 seq2seq 模型。
查看答案
正確答案: B
問題 #8
一位機器學習專家正在構建一個邏輯回歸模型,以預測一個人是否會訂購披薩。該專家正試圖用一個理想的分類閾值建立一個最佳模型。該專家應該使用哪種模型評估技術來了解不同的分類閾值會對模型的性能產生怎樣的影響?
A. 收器工作特徵曲線(ROC)
B. 誤判率
C. 方根誤差 (RMSE)
D. 1 準則
查看答案
正確答案: A
問題 #9
一位機器學習專家正在使用 Amazon SageMaker 構建一個將執行時間序列預測的模型。專家已經完成了模型的訓練,現在計劃在端點上執行負載測試,以便爲模型變體配置自動擴展功能。哪種方法可以讓專家在負載測試期間查看延遲、內存利用率和 CPU 利用率?
A. 利用 Amazon Athena 和 Amazon QuickSight 查看寫入 Amazon S3 的 SageMaker 日誌,以便在生成日誌時對其進行可視化。
B. 生成 Amazon CloudWatch 儀錶板,爲 Amazon SageMaker 輸出的延遲、內存利用率和 CPU 利用率指標創建單一視圖。
C. 建自定義的 Amazon CloudWatch 日誌,然後利用 Amazon ES 和 Kibana 來查詢和可視化 Amazon SageMaker 生成的日誌數據。
D. 將 Amazon SageMaker 生成的 Amazon CloudWatch 日誌發送到 Amazon ES,並使用 Kibana 查詢和可視化日誌數據。
查看答案
正確答案: B
問題 #10
某公司在 Amazon SageMaker 中使用默認內置圖像分類算法進行訓練時發現準確率很低。數據科學團隊希望使用 Inception 神經網絡架構而不是 ResNet 架構。(選擇兩項)。
A. 應該提高學習率,因爲優化過程陷入了局部最小值。
B. 於模型不夠概括,因此應提高扁平層的輟學率。
C. 於模型不夠複雜,應增加扁平層旁邊的緻密層的維數。
D. 於優化過程在達到全局最小值之前就已終止,因此應增加曆元數。
查看答案
正確答案: CD
問題 #11
一家大型公司開發了一個商業智能應用程序,該程序可使用從各種運營指標中收集的數據生成報告和儀錶板。公司希望爲高管提供更好的體驗,讓他們可以使用自然語言從報告中獲取數據。該公司希望管理人員能夠使用書面和口語界面提問。
A. 將模型上傳到 Amazon SageMaker 筆記本實例,並使用 Amazon SageMaker HPO 功能優化模型的超參數。
B. 在訓練集中添加更多數據,並使用遷移學習重新訓練模型,以減少偏差。
C. 使用在 ImageNet 上經過預訓練的層數更多的神經網絡模型,並應用遷移學習來增加方差。
D. 使用當前的神經網絡架構訓練一個新模型。
查看答案
正確答案: BEF
問題 #12
機器學習團隊在 Amazon SageMaker 上運行自己的訓練算法。該訓練算法需要外部資產。該團隊需要向 Amazon SageMaker 提交自己的算法代碼和特定於算法的參數。該團隊應使用哪些服務組合在 Amazon SageMaker 中構建自定義算法?(選擇兩項)。
A. 0
B. 0
C. 00
D. ,400
查看答案
正確答案: CE
問題 #13
一家製造公司擁有大量帶標籤的歷史銷售數據。該製造商希望預測每季度應該生產多少個特定零件。應該使用哪種機器學習方法來解決這個問題?
A. 輯回歸
B. 隨機切割森林(RCF)
C. 成分分析(PCA)
D. 性回歸
查看答案
正確答案: B
問題 #14
一家辦公室安全機構使用安裝在主辦公室關鍵位置的 100 個攝像頭進行了一次成功的試點。攝像機拍攝的圖像上傳到亞馬遜 S3,並使用亞馬遜 Rekognition 進行標記,結果存儲在亞馬遜 ES 中。該機構現在希望將試點擴大到一個全面的生產系統,在其全球辦公地點使用數千臺攝像機。其目標是實時識別非員工進行的活動。
A. 在每個本地辦公室和每個攝像頭使用代理服務器,並將 RTSP 源流到唯一的 Amazon Kinesis Video Streams 視頻流。在每個流上,使用 Amazon Rekognition Video 並創建一個流處理器,以便從已知員工集合中檢測人臉,並在檢測到非員工時發出警報。
B. 每個本地辦公室和每個攝像頭使用代理服務器,並將 RTSP 源流到唯一的 Amazon Kinesis Video Streams 視頻流。在每個流上,使用 Amazon Rekognition Image 從已知員工集合中檢測人臉,並在檢測到非員工時發出警報。
C. 安裝 AWS DeepLens 攝像頭,並使用 DeepLens_Kinesis_Video 模塊將每個攝像頭的視頻流傳輸到 Amazon Kinesis 視頻流。在每個流上,使用 Amazon Rekognition Video 並創建一個流處理器,以便從每個流的集合中檢測人臉,並在檢測到非員工時發出警報。
D. 安裝 AWS DeepLens 攝像頭,並使用 DeepLens_Kinesis_Video 模塊將每個攝像頭的視頻流傳輸到 Amazon Kinesis 視頻流。在每個流上運行 AWS Lambda 函數捕獲圖像片段,然後調用 Amazon Rekognition Image 從已知員工集合中檢測人臉,並在檢測到非員工時發出警報。
查看答案
正確答案: A
問題 #15
一位機器學習專家希望爲端點自動擴展配置確定合適的 SageMakerVariantInvocationsPerInstance 設置。專家對單個實例進行了負載測試,確定在不降低服務質量的情況下,每秒峯值請求數(RPS)約爲 20 RPS。由於這是首次部署,專家打算將調用安全係數設爲 0.5。
A. 通過在大量與能源行業相關的新聞文章中預先訓練的詞頻-反文檔頻率(TF-IDF)向量初始化詞語。
B. 用門控遞歸單元(GRU)代替 LSTM,並運行訓練過程,直到驗證損失停止下降。
C. 低學習率並運行訓練過程,直到訓練損失停止下降。
D. 通過在大量與能源行業相關的新聞文章中進行預訓練的 word2vec 嵌入詞對詞語進行初始化。
查看答案
正確答案: C
問題 #16
一家銀行希望推出低利率信貸促銷活動。該銀行所在的城鎮最近經歷了經濟困難。該銀行只有部分客戶受到了危機的影響,因此銀行信貸團隊必須確定哪些客戶是促銷的目標客戶。銀行的數據科學團隊開發了一個模型,可對賬戶交易進行分類並了解信用記錄。
A. 使用 Amazon SageMaker Studio 重建模型。創建一個使用 XGBoost 訓練容器執行模型訓練的筆記本。在端點部署模型。啓用 Amazon SageMaker Model Monitor 以存儲推論。使用推論創建 Shapley 值,幫助解釋模型行爲。創建顯示特徵和 SHapley Additive exPlanations (SHAP) 值的圖表,向信貸團隊解釋特徵如何影響模型結果。
B. 使用 Amazon SageMaker Studio 重建模型。創建一個使用 XGBoost 訓練容器執行模型訓練的筆記本。激活 Amazon SageMaker 調試器,並將其配置爲計算和收集 Shapley 值。創建一個顯示特徵和 SHapley Additive exPlanations (SHAP) 值的圖表,向信貸團隊解釋特徵如何影響模型結果。
C. 創建 Amazon SageMaker 筆記本實例。使用筆記本實例和 XGBoost 庫在本地重新訓練模型。使用 Python XGBoost 接口中的 plot_importance() 方法創建特徵重要性圖表。使用該圖表向信貸團隊解釋特徵如何影響模型結果。
D. 使用 Amazon SageMaker Studio 重建模型。創建一個使用 XGBoost 訓練容器執行模型訓練的筆記本。在端點部署模型。使用 Amazon SageMaker Processing 對模型進行後分析,並爲信貸團隊自動創建功能重要性可解釋性圖表。
查看答案
正確答案: C
問題 #17
一家製造商運營着大量工廠,供應鏈關係複雜,一臺機器的意外停機可能導致多家工廠停產。數據科學家希望分析來自工廠的傳感器數據,以識別需要預先維護的設備,然後派遣服務團隊防止意外停機。單臺機器的傳感器讀數可包含多達 200 個數據點,包括溫度、電壓、振動、轉速和壓力。
A. 在 Amazon SageMaker 中部署模型。通過該模型運行傳感器數據,預測哪些機器需要維護。
B. 在每個工廠的 AWS IoT Greengrass 上部署模型。通過該模型運行傳感器數據,以推斷哪些機器需要維護。
C. 將模型部署到 Amazon SageMaker 批次轉換作業中。在每日批處理報告中生成推論,以確定需要維護的機器。
D. Amazon SageMaker 中部署模型,並使用物聯網規則將數據寫入 Amazon DynamoDB 表。使用 AWS Lambda 函數從表中讀取 DynamoDB 流以調用端點。
查看答案
正確答案: B
問題 #18
一位機器學習專家正在決定爲一個分類問題建立一個天真的貝葉斯模型還是一個完整的貝葉斯網絡。專家計算了每個特徵之間的皮爾遜相關係數,發現它們的絕對值在 0.1 到 0.95 之間。
A. 天真貝葉斯模型,因爲特徵都是條件獨立的。
B. 全貝葉斯網絡,因爲特徵都是有條件獨立的。
C. 天真貝葉斯模型,因爲某些特徵在統計上是依賴的。
D. 個完整的貝葉斯網絡,因爲某些特徵具有統計依賴性。
查看答案
正確答案: D
問題 #19
一位數據科學家正在建立一個線性回歸模型,並將使用得出的 p 值來評估每個係數的統計意義。在檢查數據集時,數據科學家發現大多數特徵都呈正態分布。數據集中一個特徵的曲線圖如圖所示。數據科學家應採用什麼變換來滿足線性回歸模型的統計假設?
A. 指數變換
B. 對數變換
C. 項式變換
D. 正弦變換
查看答案
正確答案: B
問題 #20
數據工程師需要使用包含客戶信用卡信息的數據集建立一個模型。
A. 用自定義加密算法加密數據,並將數據存儲在 VPC 中的 Amazon SageMaker 實例上。使用 SageMaker DeepAR 算法隨機化信用卡號碼。
B. 用 IAM 策略加密 Amazon S3 存儲桶上的數據,並使用 Amazon Kinesis 自動丟棄信用卡號並插入僞造的信用卡號。
C. 用 Amazon SageMaker 啓動配置,在數據複製到 VP 中的 SageMaker 實例後對其進行加密 使用 SageMaker 主成分分析 (PCA) 算法減少信用卡號碼的長度。
D. 用 AWS KMS 對 Amazon S3 和 Amazon SageMaker 上的數據進行加密,並使用 AWS Glue 從客戶數據中刪除信用卡號碼。
查看答案
正確答案: D
問題 #21
一個交互式在線詞典希望添加一個小工具,用於顯示在相似語境中使用的單詞。一位機器學習專家被要求爲下遊近鄰模型提供單詞特徵,爲該小工具提供動力。
A. 創建單字編碼向量
B. 用 Amazon Mechanical Turk 爲每個單詞生成一組同義詞。
C. 創建單詞嵌入向量,存儲與其他單詞的編輯距離。
D. 下載在大型語料庫中預先訓練好的詞嵌入。
查看答案
正確答案: D
問題 #22
一位機器學習專家正在對一個描述紐約市公共交通情況的數據集實施全貝葉斯網絡。其中一個隨機變量是離散的,表示紐約人等待公交車的分鐘數,條件是公交車每 10 分鐘一班,平均值爲 3 分鐘。機器學習專家應該對這個變量使用哪種先驗概率分布?
A. 松分布
B. 均勻分布
C. 態分布
D. 項分布
查看答案
正確答案: A
問題 #23
一位機器學習專家正在爲主要關注安全問題的政府用戶開發一個概念驗證。該專家正在使用 Amazon SageMaker 爲一個照片分類器應用程序訓練一個卷積神經網絡 (CNN) 模型。該專家希望保護數據,使其不會被意外安裝在訓練容器上的惡意代碼訪問並傳輸到遠程主機。
A. 使用 AWS Identity and Access Management (IAM) 創建勞動力。使用 Amazon Simple Queue Service(Amazon SQS)在 Amazon EC2 隊列圖像上構建一個標籤工具,用於標籤。編寫標籤說明。
B. 創建 Amazon Mechanical Turk 勞動力和清單文件。使用 Amazon SageMaker Ground Truth 中的內置圖像分類任務類型創建標籤任務。編寫標籤說明。
C. 建私有勞動力和清單文件。使用 Amazon SageMaker Ground Truth 中的內置邊界框任務類型創建標籤任務。編寫標籤說明。
D. 用 Amazon Cognito 創建勞動力。使用 AWS Amplify 構建標籤網絡應用程序。使用 AWS Lambda 構建標籤工作流程後端。編寫標籤說明。
查看答案
正確答案: D
問題 #24
機器學習專家需要能夠採集流式數據並將其存儲到 Apache Parquet 文件中,以便進行探索和分析。
A. AWS DMS
B. mazon Kinesis 數據流
C. mazon Kinesis Data Firehose
D. mazon Kinesis 數據分析
查看答案
正確答案: C
問題 #25
機器學習專家將數據集上傳到使用 AWS KMS 進行服務器端加密保護的 Amazon S3 存儲桶。
A. 定義安全組以允許所有 HTTP 入站/出站流量,並將這些安全組分配給 Amazon SageMaker 筆記本實例。
B. 配置 Amazon SageMaker 筆記本實例,使其能夠訪問 VPC。在 KMS 密鑰策略中爲筆記本的 KMS 角色授予權限。
C. 爲 Amazon SageMaker 筆記本分配一個 IAM 角色,該角色具有對數據集的 S3 讀取訪問權限。在 KMS 密鑰策略中爲該角色授予權限。
D. 用於在 Amazon S3 中加密數據的 KMS 密鑰分配給 Amazon SageMaker 筆記本實例。
查看答案
正確答案: D
問題 #26
機器學習專家正在配置 Amazon SageMaker,以便多名數據科學家能夠訪問筆記本、訓練模型和部署端點。爲確保最佳運行性能,專家需要能夠跟蹤科學家部署模型的頻率、已部署 SageMaker 端點的 GPU 和 CPU 利用率,以及調用端點時產生的所有錯誤。(選擇兩個)。
A. 要求商店轉而在 AWS Storage Gateway 上本地捕獲數據並加載到 Amazon S3,然後使用 AWS Glue 進行轉換。
B. 部署一個運行 Apache Spark 並帶有轉換邏輯的 Amazon EMR 集羣,讓該集羣每天在 Amazon S3 中的累積記錄上運行,將新記錄/轉換記錄輸出到 Amazon S3。
C. pin up a fleet of Amazon EC2 instances with the transformation logic, have them transform the data records accumulated on Amazon S3, and output the transformed records to Amazon S3
D. 在 Kinesis Data Firehose 流的下遊插入 Amazon Kinesis Data Analytics 流,使用 SQL 將原始記錄屬性轉換爲簡單的轉換值。
查看答案
正確答案: AD
問題 #27
數據科學家必須在亞馬遜 SageMaker 中爲一家在線零售公司建立一個自定義推薦模型。由於公司產品的性質,客戶每 5-10 年才購買 4-5 件產品。因此,該公司依賴於源源不斷的新客戶。當新客戶註冊時,公司會收集客戶的偏好數據。下面是數據科學家可以使用的數據樣本。對於這個用例,數據科學家應該如何將數據集分成訓練集和測試集?
A. 所有交互數據進行洗牌。從交互數據中抽取最後 10%作爲測試集。
B. 找出每個用戶最近 10%的互動。將這些互動拆分爲測試集。
C. 找出交互數據最少的 10%用戶。將這些用戶的所有交互數據分離出來,作爲測試集。
D. 隨機抽取 10%的用戶。將這些用戶的所有交互數據分離出來,作爲測試集。
查看答案
正確答案: D
問題 #28
一位數據科學家正在使用亞馬遜 SageMaker 內置的 BlazingText 算法訓練一個文本分類模型。數據集中有 5 個類別,A 類有 300 個樣本,B 類有 292 個樣本,C 類有 240 個樣本,D 類有 258 個樣本,E 類有 310 個樣本。訓練模型後,數據科學家爲訓練集和測試集生成混淆矩陣。數據科學家可以得出哪些結論?
A. 自回歸綜合移動平均法(AIRMA)
B. 指數平滑法 (ETS)
C. 卷積神經網絡 - 量化回歸(CNN-QR)
D. 知
查看答案
正確答案: A
問題 #29
一位機器學習專家使用 Amazon SageMaker 啓動了基於樹的集合模型的超參數調整工作,並將 ROC 曲線下面積 (AUC) 作爲目標指標。該工作流最終將部署到一個管道中,該管道每晚都會重新訓練和調整超參數,以便對每 24 小時就會過時的數據的點擊率進行建模。
A. 顯示最重要輸入特徵是否爲高斯特徵的直方圖
B. 根據目標變量對點進行着色的散點圖,採用 t 分布隨機鄰域嵌入(t-SNE)技術,以更易於閱讀的維度直觀顯示大量輸入變量。
C. 散點圖顯示目標指標在每次訓練迭代中的表現。
D. 散點圖顯示了最大樹深與客觀指標之間的相關性。
查看答案
正確答案: B
問題 #30
某公司爲客戶提供網上購物服務。該公司希望在客戶從不同於其正常位置的地點訪問網站時請求額外信息,從而增強網站的安全性。該公司希望更新流程,調用機器學習 (ML) 模型來確定何時需要請求額外信息。
A. 使用 Amazon SageMaker Ground Truth 將每條記錄標記爲訪問嘗試成功或失敗。使用 Amazon SageMaker 使用因式分解機 (FM) 算法訓練二元分類模型。
B. 使用 Amazon SageMaker 使用 IP Insights 算法訓練模型。安排每晚使用新日誌數據更新和重新訓練模型。
C. 用 Amazon SageMaker Ground Truth 將每條記錄標記爲成功或失敗的訪問嘗試。使用 Amazon SageMaker 使用 IP Insights 算法訓練二進制分類模型。
D. 使用 Amazon SageMaker 使用 Object2Vec 算法訓練模型。安排每晚使用新日誌數據更新和重新訓練模型。
查看答案
正確答案: B
問題 #31
數據科學家希望實時了解 GZIP 文件數據流的情況。哪種解決方案允許使用 SQL 以最少的延遲查詢數據流?
A. 亞馬遜 Kinesis 數據分析,使用 AWS Lambda 函數轉換數據。
B. AWS Glue 使用自定義 ETL 腳本轉換數據。
C. 馬遜 Kinesis 客戶端庫,用於轉換數據並將其保存到亞馬遜 ES 集羣。
D. Amazon Kinesis Data Firehose 轉換數據並將其放入 Amazon S3 存儲桶。
查看答案
正確答案: A
問題 #32
某產品目錄的主編希望研發團隊建立一個機器學習系統,用於檢測圖片集中的個人是否穿着該公司的零售品牌。研究人員應該使用哪種機器學習算法才能最好地滿足他們的要求?
A. atent Dirichlet Allocation (LDA)
B. 循環神經網絡(RNN)
C. -均值
D. 卷積神經網絡(CNN)
查看答案
正確答案: D
問題 #33
該專家希望創建一套數據攝取機制,以便在未來實現以下功能: - 實時分析 - 歷史數據的交互式分析 - 點擊流分析 - 產品推薦該專家應該使用哪些服務?
A. WS Glue 作爲數據目錄;Amazon Kinesis Data Streams 和 Amazon Kinesis Data Analytics 用於實時數據洞察;Amazon Kinesis Data Firehose 用於向 Amazon ES 傳輸點擊流分析;Amazon EMR 用於生成個性化產品推薦
B. mazon Athena 作爲數據目錄:Amazon Kinesis Data Streams 和 Amazon Kinesis Data Analytics 用於近實時數據洞察;Amazon Kinesis Data Firehose 用於點擊流分析;AWS Glue 用於生成個性化產品推薦
C. WS Glue 作爲數據目錄;Amazon Kinesis Data Streams 和 Amazon Kinesis Data Analytics 用於歷史數據洞察;Amazon Kinesis Data Firehose 用於向 Amazon ES 交付點擊流分析;Amazon EMR 用於生成個性化產品建議
D. mazon Athena 作爲數據目錄;Amazon Kinesis Data Streams 和 Amazon Kinesis Data Analytics 用於歷史數據洞察;Amazon DynamoDB 數據流用於點擊流分析;AWS Glue 用於生成個性化產品推薦
查看答案
正確答案: A
問題 #34
一名數據科學家正在開發一個管道,以獲取流式網絡流量數據。作爲管道的一部分,數據科學家需要實施一個流程來識別異常網絡流量模式。這些模式將在下遊用於警報和事件響應。該解決方案需要做到以下幾點:-爲每個網絡流量條目計算異常得分。
A. 使用歷史網絡流量數據,使用 Amazon SageMaker Random Cut Forest (RCF) 內置模型訓練異常檢測模型。使用 Amazon Kinesis 數據流處理傳入的網絡流量數據。附加一個預處理 AWS Lambda 函數,通過調用 RCF 模型計算每條記錄的異常得分來執行數據富集。
B. 使用 Amazon SageMaker 內置的 XGBoost 模型,使用歷史網絡流量數據訓練異常檢測模型。使用 Amazon Kinesis 數據流處理傳入的網絡流量數據。附加一個預處理 AWS Lambda 函數,通過調用 XGBoost 模型計算每條記錄的異常得分來執行數據濃縮。
C. 用 Amazon Kinesis Data Firehose 收集流數據。將交付流映射爲 Amazon Kinesis Data Analytics 的輸入源。使用 k-Nearest Neighbors (kNN) SQL 擴展編寫針對流數據實時運行的 SQL 查詢,以使用翻滾窗口計算每條記錄的異常得分。
D. 用 Amazon Kinesis Data Firehose 收集流數據。將交付流映射爲 Amazon Kinesis Data Analytics 的輸入源。編寫 SQL 查詢,使用 Amazon Random Cut Forest (RCF) SQL 擴展針對流數據實時運行,以使用滑動窗口計算每條記錄的異常得分。
查看答案
正確答案: D
問題 #35
一位機器學習專家正在構建一個卷積神經網絡(CNN),對 10 種動物進行分類。該專家在神經網絡中構建了一系列層,這些層將接收動物的輸入圖像,然後通過一系列卷積層和池化層,最後通過一個有 10 個節點的密集全連接層。專家希望從神經網絡中得到一個輸出,即輸入圖像的可能性分布。
A. 均方根誤差 (RMSE)
B. 殘差圖
C. 線下面積
D. 淆矩陣
查看答案
正確答案: C
問題 #36
某公司希望將用戶行爲分爲欺詐行爲和正常行爲。根據內部研究,機器學習專家希望根據賬戶年齡和交易月份這兩個特徵建立一個二元分類器。根據這些信息,哪個模型的準確率最高?
A. 有縮放指數線性單元(SELU)的長短期記憶(LSTM)模型
B. 輯回歸
C. 帶非線性內核的支持向量機(SVM)
D. 帶有 tanh 激活函數的單感知器
查看答案
正確答案: C
問題 #37
一家零售公司的開發人員正在創建一個每日需求預測模型。該公司將每小時的歷史需求數據存儲在亞馬遜 S3 存儲桶中。該開發人員希望驗證自回歸綜合移動平均法 (ARIMA) 是否適合該用例。
A. 使用 Amazon SageMaker Data Wrangler。從亞馬遜 S3 導入數據。計算每小時的缺失數據。進行季節趨勢分解。
B. 用 Amazon SageMaker Autopilot。創建指定 S3 數據位置的新實驗。選擇 ARIMA 作爲機器學習 (ML) 問題。檢查模型性能。
C. 使用 Amazon SageMaker Data Wrangler。從亞馬遜 S3 導入數據。使用每日合計數據重新採樣。進行季節趨勢分解。
D. 用 Amazon SageMaker Autopilot。創建指定 S3 數據位置的新實驗。補償缺失的小時值。選擇 ARIMA 作爲機器學習 (ML) 問題。檢查模型性能。
查看答案
正確答案: A
問題 #38
一位機器學習專家正在將一個自定義 ResNet 模型打包到一個 Docker 容器中,以便公司利用 Amazon SageMaker 進行訓練。該專家使用 Amazon EC2 P3 實例來訓練模型,並需要正確配置 Docker 容器以利用英偉達™(NVIDIA®)GPU。
A. 將英偉達驅動程序與 Docker 映像捆綁在一起。
B. 構建與英偉達™(NVIDIA®)Docker 兼容的 Docker 容器。
C. 理 Docker 容器的文件結構,以便在 GPU 實例上執行。
D. Amazon SageMaker CreateTrainingJob 請求正文中設置 GPU 標誌。
查看答案
正確答案: B
問題 #39
一家寵物保險公司的營銷經理計劃在社交媒體上發起一場有針對性的營銷活動,以獲得新客戶。目前,該公司在 Amazon Aurora 中擁有以下數據:-所有過去和現有客戶的檔案-所有過去和現有投保寵物的檔案-保單級別信息-收到的保費-已支付的理賠金應該採取哪些步驟來實施機器學習模型,以識別社交媒體上的潛在新客戶?
A. 使用客戶資料數據回歸法了解消費者羣體的關鍵特徵。在社交媒體上查找類似資料
B. 用客戶資料數據聚類來了解消費者羣體的主要特徵。在社交媒體上查找類似的資料
C. 用客戶資料數據推薦引擎,了解消費者羣體的關鍵特徵。在社交媒體上查找類似的資料。
D. 客戶檔案數據上使用決策樹分類引擎,了解消費者羣體的關鍵特徵。在社交媒體上查找類似的資料。
查看答案
正確答案: C
問題 #40
機器學習專家必須建立一個流程,使用 Amazon Athena 在 Amazon S3 上查詢一個數據集。數據集包含 800,000 多條以明文 CSV 文件格式存儲的記錄。每條記錄包含 200 列,大小約爲 1.5 MB。機器學習專家應如何轉換數據集,以儘量縮短查詢運行時間?
A. 將記錄轉換爲 Apache Parquet 格式。
B. 將記錄轉換爲 JSON 格式。
C. 將記錄轉換爲 GZIP CSV 格式。
D. 將記錄轉換爲 XML 格式。
查看答案
正確答案: A
問題 #41
一家房地產公司希望根據歷史數據集創建一個預測房價的機器學習模型。數據集包含 32 個特徵,哪個模型能滿足業務需求?
A. 輯回歸
B. 性回歸
C. -均值
D. 成分分析(PCA)
查看答案
正確答案: B
問題 #42
一家醫療保健公司計劃使用神經網絡將其 X 光圖像分爲正常和異常兩類。標註數據分爲由 1000 張圖像組成的訓練集和由 200 張圖像組成的測試集。最初訓練一個有 50 個隱藏層的神經網絡模型時,訓練集的準確率爲 99%,但測試集的準確率只有 55%。(選擇三個)。
A. 提前停止
B. 用適當的種子隨機初始化權重
C. 增加歷時次數
D. 用 100 個神經元再添加一層
查看答案
正確答案: BDF
問題 #43
機器學習專家在比較/評估機器學習分類模型時,一般應使用以下哪些指標?
A. 回顧
B. 誤判率
C. 均絕對百分比誤差 (MAPE)
D. OC曲線下面積(AUC)
查看答案
正確答案: D
問題 #44
亞馬遜 S3 中提供了所有這些產品的全部銷售歷史記錄。目前,該公司正在使用定製的自回歸綜合移動平均 (ARIMA) 模型來預測這些產品的需求。該公司希望預測即將推出的新產品的需求。
A. rain a custom ARIMA model to forecast demand for the new product
B. 訓練亞馬遜 SageMaker DeepAR 算法,預測新產品的需求。
C. rain an Amazon SageMaker k-means 聚類算法來預測新產品的需求。
D. 訓練自定義 XGBoost 模型,預測新產品的需求。
查看答案
正確答案: B
問題 #45
一家遊戲公司推出了一款在線遊戲,人們可以免費開始遊戲,但如果他們選擇使用某些功能,就需要付費。該公司需要建立一個自動系統來預測新用戶是否會在一年內成爲付費用戶。該公司從 100 萬用戶中收集了一個標註數據集。訓練數據集包括 1000 個正樣本(來自在 1 年內最終付費的用戶)和 99.9 萬個負樣本(來自未使用任何付費功能的用戶)。
A. 刪除數據集中所有年齡設置爲 0 的記錄。
B. 數據集的平均值或中位值替換年齡字段值爲 0 的記錄
C. 從數據集中刪除年齡特徵,然後使用其他特徵訓練模型。
D. 用 K 均值聚類處理缺失特徵
查看答案
正確答案: CD
問題 #46
某公司將使用 Amazon SageMaker 爲營銷活動訓練和託管一個機器學習 (ML) 模型。大部分數據都是敏感的客戶數據。數據必須在靜態時加密。該公司希望 AWS 維護主密鑰的信任根,並希望記錄加密密鑰的使用情況。
A. 使用存儲在 AWS Cloud HSM 中的加密密鑰對 ML 數據卷進行加密,並對 Amazon S3 中的模型工件和數據進行加密。
B. 用 SageMaker 內置的暫存密鑰加密 ML 數據卷。爲新的 Amazon Elastic Block Store (Amazon EBS) 卷啓用默認加密。
C. AWS 密鑰管理服務 (AWS KMS) 中使用客戶管理的密鑰對 ML 數據卷進行加密,並對 Amazon S3 中的模型工件和數據進行加密。
D. 用 AWS 安全令牌服務 (AWS STS) 創建臨時令牌,以加密 ML 存儲卷,並加密 Amazon S3 中的模型工件和數據。
查看答案
正確答案: C
問題 #47
某公司希望將用戶行爲分爲欺詐行爲和正常行爲。根據內部研究,機器學習專家將根據兩個特徵建立二元分類器:賬戶年齡(用 x 表示)和交易月份(用 y 表示)。哪個模型的準確率最高?
A. 線性支持向量機(SVM)
B. 決策樹
C. 採用徑向基函數核的支持向量機(SVM)
D. 帶有 Tanh 激活函數的單感知器
查看答案
正確答案: C
問題 #48
一個數據科學團隊正計劃構建一個自然語言處理(NLP)應用程序。該應用程序的文本預處理階段將包括語音部分標記和關鍵階段提取。預處理後的文本將輸入數據科學團隊已經編寫並使用 Apache MXNet 訓練好的自定義分類算法。
A. 使用 Amazon Comprehend 完成語音部分標記、關鍵階段提取和分類任務。
B. 使用 Amazon SageMaker 中的 NLP 庫進行語音部分標記。使用 Amazon Comprehend 進行關鍵階段提取。使用 AWS 深度學習容器和 Amazon SageMaker 來構建自定義分類器。
C. 用 Amazon Comprehend 完成語音部分標記和關鍵階段提取任務。使用 Amazon SageMaker 內置的 Latent Dirichlet Allocation (LDA) 算法構建自定義分類器。
D. 用 Amazon Comprehend 執行語音部分標記和關鍵階段提取任務。使用 AWS 深度學習容器和 Amazon SageMaker 構建自定義分類器。
查看答案
正確答案: B
問題 #49
一家在線經銷商有一個大型多列數據集,其中一列缺失了 30% 的數據。機器學習專家認爲,數據集中的某些列可以用來重建缺失的數據。該專家應該使用哪種重建方法來保持數據集的完整性?
A. 表刪除
B. 結轉的上一次觀測結果
C. 重估算
D. 平均替代
查看答案
正確答案: C
問題 #50
一家公司正在推出一款新產品,需要建立一種機制來監控社交媒體上有關該公司及其新產品的評論。該公司需要能夠評估社交媒體帖子中表達的情感,可視化趨勢,並根據各種閾值配置警報。該公司需要快速實施該解決方案,並希望最大限度地減少評估信息所需的基礎設施和數據科學資源。該公司已經有了一個解決方案來收集社交媒體帖子中的情感信息,並根據不同的閾值對趨勢和警報進行可視化配置。
A. 使用 BlazingText 算法在 Amazon SageMaker 中訓練一個模型,以檢測社交媒體帖子語料庫中的情感。暴露一個可被 AWS Lambda 調用的端點。當帖子添加到 S3 存儲桶時觸發一個 Lambda 函數,以調用端點並在 Amazon DynamoDB 表和自定義 Amazon CloudWatch 指標中記錄情感。使用 CloudWatch 警報通知分析師趨勢。
B. 使用語義分割算法在 Amazon SageMaker 中訓練一個模型,爲社交媒體帖子語料庫中的語義內容建模。暴露一個可被 AWS Lambda 調用的端點。當對象添加到 S3 存儲桶時觸發一個 Lambda 函數,以調用端點並在 Amazon DynamoDB 表中記錄情感。安排第二個 Lambda 函數來查詢最近添加的記錄,並發送亞馬遜簡單通知服務(Amazon SNS)通知,向分析師通報趨勢。
C. 社交媒體帖子添加到 S3 桶時觸發 AWS Lambda 函數。爲每個帖子調用 Amazon Comprehend 以捕獲消息中的情感,並將情感記錄到 Amazon DynamoDB 表中。安排第二個 Lambda 函數來查詢最近添加的記錄,並發送 Amazon Simple Notification Service (Amazon SNS) 通知,向分析師通報趨勢。
D. 社交媒體帖子添加到 S3 存儲桶時觸發 AWS Lambda 函數。爲每個帖子調用 Amazon Comprehend 以捕獲消息中的情感,並將情感記錄在自定義的 Amazon CloudWatch 指標和 S3 中。使用 CloudWatch 警報通知分析師趨勢。
查看答案
正確答案: D
問題 #51
一位數據科學家正在開發一個機器學習模型,以根據收集到的每位患者及其治療計劃的信息預測患者未來的治療效果。該模型應輸出一個連續值作爲預測值。現有數據包括一組 4000 名患者的標記結果。研究對象是一組 65 歲以上的人,他們患有一種已知會隨着年齡增長而惡化的特殊疾病。在審查基礎數據時,T
A. 將數據集存儲爲 Amazon S3 中的文件。
B. 將數據集作爲文件存儲在連接到 Amazon EC2 實例的 Amazon EBS 卷中。
C. 在多節點 Amazon Redshift 集羣中將數據集存儲爲表。
D. 將數據集存儲爲 Amazon DynamoDB 中的全局表。
查看答案
正確答案: D
問題 #52
某公司正在運行一項機器學習預測服務,每天會生成 100 TB 的預測結果。機器學習專家必須根據預測結果生成每日精度-召回曲線的可視化圖表,並將只讀版本轉發給業務團隊。
A. 行每日 Amazon EMR 工作流程以生成精確調用數據,並將結果保存在 Amazon S3 中。授予業務團隊對 S3 的只讀訪問權限。
B. 在 Amazon QuickSight 中生成每日精確調用數據,並在與業務團隊共享的儀錶板中發布結果。
C. 行每日亞馬遜 EMR 工作流以生成精確調用數據,並將結果保存在亞馬遜 S3 中。在 Amazon QuickSight 中對陣列進行可視化,並將其發布到與業務團隊共享的儀錶板中。
D. 亞馬遜 ES 中生成每日精確調用數據,並在與業務團隊共享的儀錶板中發布結果。
查看答案
正確答案: C
問題 #53
一位機器學習專家正計劃創建一個長期運行的亞馬遜 EMR 集羣。EMR 集羣將有 1 個主節點、10 個核心節點和 20 個任務節點。爲了節約成本,專家將在 EMR 集羣中使用 Spot Instances。
A. 主節點
B. 任何核心節點
C. 何任務節點
D. 核心節點和任務節點
查看答案
正確答案: C
問題 #54
數據科學家已經探索並淨化了一個數據集,爲監督學習任務的建模階段做準備。不同特徵之間的統計離散度可能相差很大,有時甚至相差幾個數量級。在進入建模階段之前,該數據科學家希望確保生產數據的預測性能儘可能準確。
A. 對數據集進行隨機抽樣。然後將數據集分成訓練集、驗證集和測試集。
B. 將數據集分成訓練集、驗證集和測試集。然後調整訓練集的比例,並對驗證集和測試集應用相同的比例。
C. 重新縮放數據集。然後將數據集分成訓練集、驗證集和測試集。
D. 將數據集分成訓練集、驗證集和測試集。然後分別對訓練集、驗證集和測試集進行重新縮放。
查看答案
正確答案: D
問題 #55
一家製造公司使用機器學習(ML)模型來檢測質量問題。這些模型使用的是公司產品在每個生產步驟結束時拍攝的圖像。該公司在生產現場擁有數千臺機器,平均每秒生成一張圖像。在試驗中,ML 專家使用了一臺運行 AWS IoT Greengrass 的工業 PC,該 PC 帶有一個長期運行的 AWS Lambda 函數,可將圖像上傳到 Ama
A. 在生產站點和最近的 AWS 區域之間建立 10 Gbps AWS Direct Connect 連接。使用直接連接連接上傳圖像。增加 SageMaker 端點使用的實例大小和實例數量。
B. 擴展在 AWS IoT Greengrass 上運行的長期運行的 Lambda 函數,以壓縮圖像並將壓縮文件上傳到亞馬遜 S3。使用單獨的 Lambda 函數來解壓文件,該函數調用現有的 Lambda 函數來運行推理管道。
C. SageMaker 使用自動擴展。在生產站點和最近的 AWS 區域之間建立 AWS Direct Connect 連接。使用直接連接連接上傳圖像。
D. 將 Lambda 函數和 ML 模型部署到 AWS IoT Greengrass 內核上,該內核在安裝在每臺機器上的工業 PC 上運行。擴展在 AWS IoT Greengrass 上運行的長期運行的 Lambda 函數,利用捕獲的圖像調用 Lambda 函數,並在直接將結果轉發到網絡服務的邊緣組件上運行推理。
查看答案
正確答案: D
問題 #56
一家公司正在建立一種機制,讓不同部門的數據科學家和工程師訪問 Amazon SageMaker Studio 域。每個部門都有一個唯一的 SageMaker Studio 域。公司希望建立一個中央代理應用程序,數據科學家和工程師可以使用他們的公司憑據登錄。代理應用程序將使用公司現有的身份提供商(IdP)對用戶進行身份驗證。然後,該應用程序將把用戶路由到相應的 SageMaker Studi。
A. 使用 SageMaker CreatePresignedDomainUrl API,根據 DynamoDB 表爲每個域生成預指定 URL。將預指定 URL 傳遞給代理應用程序。
B. 使用 SageMaker CreateHuman TaskUi API 生成用戶界面 URL。將 URL 傳遞給代理應用程序。
C. 用 Amazon SageMaker ListHumanTaskUis API 列出所有用戶界面 URL。將適當的 URL 傳遞到 DynamoDB 表,以便代理應用程序可以使用該 URL。
D. 用 SageMaker CreatePresignedNotebookInstanceUrl應用程序接口生成預籤名 URL。將預指定 URL 傳遞給代理應用程序。
查看答案
正確答案: A
問題 #57
一家製造公司要求其機器學習專家開發一個模型,將有缺陷的部件分爲八種缺陷類型之一。該公司爲每種缺陷類型提供了大約 100,000 張圖像用於訓練。在圖像分類模型的初始訓練過程中,專家注意到驗證準確率爲 80%,而訓練準確率爲 90%。衆所周知,此類圖像分類的人類水平性能約爲 90%。
A. 更長的培訓時間
B. 擴大網絡
C. 用不同的優化器
D. 使用某種形式的正則化
查看答案
正確答案: D
問題 #58
一家公司使用亞馬遜 SageMaker 託管服務建立了機器學習 (ML) 模型,並將其部署到生產端點。ML 團隊爲其 SageMaker 實例配置了自動擴展功能,以支持工作負載變化。在測試過程中,該團隊注意到,在新實例準備就緒之前,就已經啓動了額外的實例。ML 團隊如何解決這個問題?
A. 縮短縮放活動的冷卻時間。增加配置的實例最大容量。
B. 使用 SageMaker 將當前端點替換爲多模型端點。
C. 設置 Amazon API Gateway 和 AWS Lambda 以觸發 SageMaker 推斷端點。
D. 延長縮放活動的冷卻時間。
查看答案
正確答案: D
問題 #59
一位機器學習專家正在企業 VPC 的私有子網中使用 Amazon SageMaker 筆記本實例。機器學習專家在 Amazon SageMaker 筆記本實例的 Amazon EBS 卷中存儲了重要數據,需要對該 EBS 卷進行快照。但是,ML 專家在 VPC 中找不到 Amazon SageMaker 筆記本實例的 EBS 卷或 Amazon EC2 實例。爲什麼 ML 專家在 VPC 中看不到實例?
A. mazon SageMaker 筆記本實例基於客戶帳戶內的 EC2 實例,但它們在 VPC 之外運行。
B. mazon SageMaker 筆記本實例基於客戶賬戶中的 Amazon ECS 服務。
C. mazon SageMaker 筆記本實例基於在 AWS 服務帳戶中運行的 EC2 實例。
D. mazon SageMaker 筆記本實例基於在 AWS 服務帳戶中運行的 AWS ECS 實例。
查看答案
正確答案: C
問題 #60
一位數據科學家希望使用 Amazon Forecast 爲一家零售公司建立庫存需求預測模型。該公司以 .csv 文件的形式提供了存儲在亞馬遜 S3 存儲桶中的產品歷史庫存需求數據集。下表顯示了數據集的一個示例。數據科學家應如何轉換數據?
A. 將模型作爲批量轉換作業重新部署到 M5 實例上。
B. 在 M5 實例上重新部署模型。將 Amazon Elastic Inference 附加到實例。
C. 在 P3dn 實例上重新部署模型。
D. 使用 P3 實例將模型部署到 Amazon Elastic Container Service (Amazon ECS) 集羣上。
查看答案
正確答案: A
問題 #61
某公司希望將用戶行爲分爲欺詐行爲和正常行爲。根據內部研究,機器學習專家希望根據賬戶年齡和交易月份這兩個特徵建立一個二元分類器。這些特徵的類別分布如圖所示。根據這些信息,哪個模型對欺詐類別的召回率最高?
A. 決策樹
B. 線性支持向量機(SVM)
C. aive Bayesian 分類器
D. 具有西格瑪激活函數的單感知器
查看答案
正確答案: C
問題 #62
一家保險公司正在開發一種新的車載設備,該設備使用攝像頭觀察駕駛員的行爲,並在駕駛員出現分心時發出警報。該公司在受控環境中創建了約 10,000 張訓練圖像,機器學習專家將使用這些圖像來訓練和評估機器學習模型。
A. CSV 文件
B. 鑲木地板文件
C. 縮 JSON
D. ecordIO
查看答案
正確答案: BE
問題 #63
一名機器學習專家被分配到欺詐檢測團隊,他必須調整一個 XGBoost 模型,該模型在測試數據中運行正常。然而,對於未知數據,它的工作效果卻不盡如人意。現有參數如下。爲避免過度擬合,專家應遵循哪些參數調整準則?
A. 增加 max_depth 參數值。
B. 降低 max_depth 參數值。
C. 將目標更新爲二進制:邏輯。
D. 降低 min_child_weight 參數值。
查看答案
正確答案: B
問題 #64
一位數據科學家收到一組保險記錄,每條記錄包括一個記錄 ID、200 個類別中的最終結果以及最終結果的日期。此外,還提供了索賠內容的部分信息,但僅限於 200 個類別中的少數幾個。每個結果類別在過去 3 年中都有數百條記錄。數據科學家希望提前幾個月預測每個月每個類別的索賠數量。
A. 根據索賠內容對 200 個類別逐月進行分類。
B. 利用索賠 ID 和時間戳進行強化學習,代理將確定每個月每類索賠的數量。
C. 利用索賠 ID 和時間戳進行預測,以確定每個月每類索賠的數量。
D. 通過監督學習對提供部分索賠內容信息的類別進行分類,並使用索賠 ID 和時間戳對所有其他類別進行預測。
查看答案
正確答案: C
問題 #65
一位數據科學家正在開發一個機器學習模型,用於對金融交易是否欺詐進行分類。數據科學家將 XGBoost 算法應用於數據,當訓練好的模型應用於之前未見過的驗證數據集時,會產生以下混淆矩陣。模型的準確率爲 99.1%,但數據科學家需要減少欺詐觀測值的數量。
A. 將預處理改爲使用 n-gram。
B. 遞歸神經網絡 (RNN) 添加比最大句子字數更多的節點。
C. 整與注意力機制相關的超參數。
D. 選擇不同的權重初始化類型。
查看答案
正確答案: DE
問題 #66
數據科學家需要分析就業數據。數據集包含 10 種不同特徵的約 1000 萬個人員觀測值。在初步分析過程中,數據科學家注意到收入和年齡分布不正常。收入水平顯示出預期的右偏斜,收入較高的人較少,而年齡分布也顯示出右偏斜,參加工作的老年人較少。
A. 在用於訓練的迷你批次中增加訓練數據的隨機性
B. 將總體數據的更高比例分配給訓練數據集
C. 訓練中應用 L1 或 L2 正則化和 dropouts
D. 少深度學習網絡的層數和單元(或神經元)數量
查看答案
正確答案: BD
問題 #67
一位機器學習專家正在訓練一個模型,以識別圖像中車輛的品牌和型號。專家希望使用遷移學習和在普通物體圖像上訓練的現有模型。專家整理了一個包含不同汽車品牌和型號的大型自定義圖片數據集。專家應該如何初始化模型,以便使用自定義數據重新訓練模型?
A. 在所有層(包括最後一個全連接層)中使用隨機權重對模型進行初始化。
B. 用預先訓練好的各層權重初始化模型,並替換最後一層全連接層。
C. 在所有層中以隨機權重初始化模型,並替換最後一個全連接層。
D. 在所有層(包括最後一個全連接層)中使用預先訓練好的權重對模型進行初始化。
查看答案
正確答案: B
問題 #68
某公司將網絡廣告點擊中的機器學習 (ML) 數據導入 Amazon S3 數據湖。點擊數據通過使用 Kinesis Producer Library (KPL) 添加到 Amazon Kinesis 數據流中。數據通過 Amazon Kinesis Data Firehose 傳輸流從數據流加載到 S3 數據湖。隨着數據量的增加,ML 專家注意到,攝取到 Amazon S3 的數據速率相對穩定。Kinesis 數據流的數據積壓也越來越多。
A. 增加交付流寫入的 S3 前綴數量。
B. 縮短數據流的保留時間。
C. 增加數據流的分片數量。
D. 用 Kinesis 客戶端庫 (KCL) 添加更多消費者。
查看答案
正確答案: C
問題 #69
一家律師事務所每天要處理成千上萬份合同。每份合同都必須籤名。該律師事務所正在開發一種機器學習 (ML) 解決方案,以自動檢測每份合同的籤名。該 ML 解決方案還必須爲每個合同頁面提供置信度分數。該律師事務所可以使用 Amazon Textract API 中的哪個操作來爲每個合同的每個頁面生成置信度分數?
A. 使用 AnalyzeDocument API 操作。將 FeatureTypes 參數設置爲 SIGNATURES。返回每個頁面的置信度分數。
B. 對文檔使用預測 API 調用。返回每一頁的籤名和置信度分數。
C. 用 StartDocumentAnalysis API 操作來檢測籤名。返回每個頁面的置信度分數。
D. 用 GetDocumentAnalysis API 操作來檢測籤名。返回每個頁面的置信度分數
查看答案
正確答案: A
問題 #70
一位機器學習專家正在爲 Amazon SageMaker 設計一個可擴展的數據存儲解決方案。現有一個基於 TensorFlow 的模型是以 train.py 腳本的形式實現的,它依賴於目前存儲爲 TFRecords 的靜態訓練數據。向 Amazon SageMaker 提供訓練數據的哪種方法能以最少的開發開銷滿足業務需求?
A. 用 Amazon SageMaker 腳本模式,並保持 train
B. 用亞馬遜 SageMaker 腳本模式,使用 train
C. 寫 train
D. Amazon SageMaker 接受的格式準備數據。使用 AWS Glue 或 AWS Lambda 重新格式化數據並將其存儲到 Amazon S3 存儲桶中。
查看答案
正確答案: B
問題 #71
該圖顯示了一個神經網絡的訓練損失和驗證損失與歷時的對比情況。正在訓練的網絡如下:-兩個密集層,一個輸出神經元-每層 100 個神經元-100 個歷時-權重的隨機初始化在驗證集中,可以使用哪種技術來提高模型的準確性?
A. 性回歸不合適。殘差不具有恆方差。
B. 性回歸不合適。基礎數據有異常值。
C. 性回歸是合適的。殘差的均值爲零。
D. 性回歸是合適的。殘差具有恆定方差。
查看答案
正確答案: A
問題 #72
機器學習專家爲一家在線零售商工作,該零售商希望通過機器學習管道對每次客戶訪問進行分析。該數據需要通過 Amazon Kinesis Data Streams 以每秒 100 筆交易的速度攝取,JSON 數據 Blob 大小爲 100 KB。
A. 碎片
B. 0 碎片
C. 00 個碎片
D. 000 塊碎片
查看答案
正確答案: B
問題 #73
一家移動網絡運營商正在使用 Amazon Athena 和 Amazon S3 構建一個分析平臺,以分析和優化公司的運營。源系統以 .CSV 格式實時發送數據。數據工程團隊希望將數據轉換爲 Apache Parquet 格式,然後再存儲到亞馬遜 S3 上。
A. 在亞馬遜 EC2 實例上使用 Apache Kafka Streams 攝取
B. 從 Amazon Kinesis Data Streams 接收
C. 在亞馬遜 EMR 集羣中使用 Apache Spark Structured Streaming 接收
D. 從 Amazon Kinesis Data Streams 攝取
查看答案
正確答案: B
問題 #74
一家圖書館正在開發使用亞馬遜 Rekognition 的自動借書系統。圖書館會員的臉部圖像存儲在亞馬遜 S3 存儲桶中。當會員借書時,Amazon Rekognition CompareFaces API 操作會將真實面孔與 Amazon S3 中存儲的面孔進行比較。圖書館需要通過確保圖像在靜態時加密來提高安全性。此外,當圖像與 Amazon Rekognition 一起使用時,它們需要在傳輸過程中加密。圖書館還必須確保
A. 在 S3 存儲桶上啓用服務器端加密。提交 AWS 支持單,選擇不允許使用圖像來改進服務,並遵循 AWS 支持提供的流程。
B. 用 Amazon Rekognition 集合來存儲圖像。使用 IndexFaces 和 SearchFacesByImage API 操作,而不是 CompareFaces API 操作。
C. 而使用 AWS GovCloud (US) 區域的 Amazon S3 來存儲圖像,並使用 Amazon Rekognition 來比較人臉。建立 VPN 連接,僅通過 VPN 調用 Amazon Rekognition API 操作。
D. S3 存儲桶上啓用客戶端加密。建立 VPN 連接,僅通過 VPN 調用 Amazon Rekognition API 操作。
查看答案
正確答案: A
問題 #75
一家物流公司需要一個預測模型來預測下個月 10 個倉庫中單一商品的庫存需求。機器學習專家利用亞馬遜預測系統,從 3 年的月度數據中開發出一個預測模型。數據沒有缺失。該專家選擇 DeepAR+ 算法來訓練預測器。預測器的均值絕對百分比誤差 (MAPE) 遠遠大於當前人工預測器產生的 MAPE。
A. 使用 AWS Glue 中的 ETL 作業將數據集分爲目標時間序列數據集和項元數據數據集。將這兩個數據集作爲
B. 使用 Amazon SageMaker 中的 Jupyter 筆記本將數據集分爲相關的時間序列數據集和項目元數據數據集。將這兩個數據集作爲表格上傳到 Amazon Aurora。
C. 使用 AWS 批量作業將數據集分爲目標時間序列數據集、相關時間序列數據集和項目元數據數據集。將它們從本地計算機直接上傳到 Forecast。
D. 使用 Amazon SageMaker 中的 Jupyter 筆記本將數據轉換爲優化的 protobuf recordIO 格式。將此格式的數據集上傳到 Amazon S3。
查看答案
正確答案: AD
問題 #76
一家公司正在建立 Amazon SageMaker 環境。公司的數據安全政策不允許通過互聯網進行通信。該公司如何才能在不通過互聯網直接訪問 Amazon SageMaker 筆記本實例的情況下啓用 Amazon SageMaker 服務?
A. 在企業 VPC 內創建一個 NAT 網關。
B. 通過內部網絡路由 Amazon SageMaker 流量。
C. 在企業 VP 內創建 Amazon SageMaker VPC 接口端點
D. 託管 Amazon SageMaker 的 Amazon VPC 創建 VPC 對等。
查看答案
正確答案: C

提交後看答案

請提交您的電子郵件和WhatsApp以獲取問題的答案。

注意:請確保您的電子郵件 ID 和 Whatsapp 有效,以便您獲得正確的考試結果。

電子郵件:
WhatsApp/電話號碼: