機械学習のスペシャリストが、世界中の企業のセキュリティイベントをリアルタイムで管理している大手サイバーセキュリティ企業と仕事をしている。サイバーセキュリティ企業は、機械学習を使用して、取り込まれたデータの異常として悪意のあるイベントをスコア化できるソリューションを設計したいと考えている。
A. Amazon Kinesis Data Firehoseを使用してデータをインジェストし、Amazon Kinesis Data Analytics Random Cut Forest (RCF)を使用して異常検知を行う。 その後、Kinesis Data Firehoseを使用して結果をAmazon S3にストリーミングする。
B. Amazon EMを使ってApache Spark Streamingにデータを取り込む。
C. そして、Spark MLlibとk-meansを使用して異常検知を行い、その結果をデータレイクとしてAmazon EMRをレプリケーション係数3で使用してApache Hadoop分散ファイルシステム(HDFS)に保存する。
D. データをインジェストしてAmazon S3に保存する AWS BatchとAWS Deep Learning AMIを使用して、Amazon S3のデータでTensorFlowを使用してk-meansモデルをトレーニングする。
E. データを取り込み、Amazon S3に保存する。オンデマンドでトリガーされるAWS Glueジョブが新しいデータを変換し、Amazon SageMakerに内蔵されているランダムカットフォレスト(RCF)モデルを使用してデータの異常を検出する。