一家電信公司正在爲其客戶開發一款移動應用程序。該公司正在使用 Amazon SageMaker 託管端點進行機器學習模型推斷。開發人員希望爲訂閱應用程序預覽功能的少數用戶推出新版本的模型。新版模型作爲預覽版進行測試後,開發人員將評估其準確性。如果新版本的模型具有更好的準確性,開發人員需要能夠逐步發布新版本的模型。
A. 使用初始變量權重參數設置爲 0 的 CreateEndpointConfig 操作,用新版本的模型更新 ProductionVariant 數據類型。 爲訂閱預覽功能的用戶指定 InvokeEndpoint 調用的 TargetVariant 參數。當模型的新版本準備好發布時,逐步增加 InitialVariantWeight,直到所有用戶都擁有更新的版本。
B. 配置兩個 SageMaker 託管端點,爲不同版本的模型提供服務。創建應用程序負載平衡器 (ALB),根據 TargetVariant 查詢字符串參數將流量路由到這兩個端點。重新配置應用程序,爲訂閱預覽功能的用戶發送 TargetVariant 查詢字符串參數。當模型的新版本準備發布時,將 ALB 的路由算法改爲加權算法,直到所有用戶都擁有更新的版本。
C. 通過使用更新端點權重和容量操作,將 DesiredWeight 參數設置爲 0,用新版本的模型更新 DesiredWeightsAndCapacity 數據類型。 爲訂閱預覽功能的用戶指定 InvokeEndpoint 調用的 TargetVariant 參數。當模型的新版本可以發布時,逐步增加 DesiredWeight,直到所有用戶都擁有更新的版本。
D. 置兩個 SageMaker 託管端點,爲不同版本的模型提供服務。創建一個 Amazon Route 53 記錄,該記錄使用簡單路由策略進行配置,並指向當前版本的模型。配置移動應用程序,使訂閱預覽功能的用戶使用端點 URL,其他用戶使用 Route 53 記錄。當模型的新版本準備發布時,在 Route 53 中添加一個新的模型版本端點,並將策略切換爲加權,直到所有用戶都擁有更新的版本。