問題 22:一家零售連鎖店一直在使用 Amazon Kinesis Data Firehose 從其 20,000 家門店網絡向 Amazon S3 輸入採購記錄。爲了支持訓練一個改進的機器學習模型,訓練記錄將需要新的但簡單的轉換,而且一些屬性將被合併。模型需要每天重新訓練。考慮到大量存儲和傳統的數據攝取,哪種變更所需的開發工作量最少?
A. 求商店轉而在 AWS 存儲網關上本地捕獲數據並加載到 Amazon S3,然後使用 AWS Glue 進行轉換。
B. 署一個運行帶有轉換邏輯的 Apache Spark 的 Amazon EMR 集羣,讓該集羣每天對 Amazon S3 中的累積記錄運行,並將新記錄/轉換記錄輸出到 Amazon S3。
C. 用轉換邏輯啓動一組 Amazon EC2 實例,讓它們轉換 Amazon S3 上積累的數據記錄,並將轉換後的記錄輸出到 Amazon S3。
D. Kinesis Data Firehose 流的下遊插入 Amazon Kinesis Data Analytics 流,使用 SQL 將原始記錄屬性轉換爲簡單的轉換值。