AWSはデータウェアハウスサービス「Amazon Redshift」のクラスタから、機械学習モデルの作成や学習、デプロイができる「Amazon Redshift ML」を一般公開した。学習済みモデルをSQL関数として使用できる。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Amazon Web Services(AWS)は2021年6月1日、「Amazon Redshift ML」(以下、Redshift ML)を一般公開した。データウェアハウスサービス「Amazon Redshift」(以下、Redshift)のクラスタから、機械学習モデルの作成や学習、デプロイができる。
これまでRedshiftのデータを処理して機械学習モデルに与え、データウェアハウス内のデータを基にこのモデルに予測させるには手間がかかっていた。学習データをRedshiftから「Amazon S3」にエクスポートし、「Amazon SageMaker」などの学習プロセスを設定する必要があったからだ。Redshift MLを利用すると、これらの処理をSQL文で指定でき、自動実行が可能になる。
Redshift MLのSQL文を実行すると、Redshift MLは指定されたデータをRedshiftからS3にエクスポートし、SageMaker Autopilotを呼び出してデータを準備する。その後、事前構築済みのアルゴリズムを適用して、モデルの学習を実施する。
その際、オプションを指定することで「XGBoost」など、使用するアルゴリズムを特定可能だ。モデルの学習が完了すると、Redshift MLはSageMaker Neoを使用してモデルをデプロイ用に最適化し、SQL関数として使用できるようにする。
Redshift MLを利用できるAWSリージョンは複数ある。米国東部(オハイオとバージニア北部)、米国西部(オレゴンとサンフランシスコ)、カナダ(中部)、欧州(フランクフルト、アイルランド、パリ、ストックホルム)、アジアパシフィック(香港、東京、シンガポール、シドニー)、南米(サンパウロ)だ。
なお、SQL関数を使用して予測が可能なAWSの機械学習機能には、他に「Amazon Aurora ML」や「Amazon Athena ML」がある。Redshift MLは、SQLによって学習可能な点が、これらとは異なる。
Copyright © ITmedia, Inc. All Rights Reserved.