Amazon Web Services(AWS)は2015年4月10日(日本時間)、機械学習技術を容易に使えるようにするサービス「Amazon Machine Learning」を発表した。これがどんなサービスなのかを簡潔に紹介する。
Amazon Web Services(AWS)は2015年4月10日(日本時間)、「Amazon Machine Learning」、というサービスを発表しました。発表時点では、「U.S. East」(ノースバージニア)リージョンで提供開始されています。
これは、機械学習技術に詳しくない人でも、これを活用したアプリケーションをつくれるようにするサービスです。つまり、アプリケーションからAPIで、このサービスを呼び出して活用できます。以下では、AWSのブログ、チュートリアルなどの情報に基づき、このサービスが何の役に立ち、どのように使えるものなのかを紹介します。
機械学習とは、ウィキペディアによれば「センサやデータベースなどからある程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出し、アルゴリズムを発展させる」ことを意味します。
Amazon Machine Learningは、アルゴリズムの詳細に立ち入ることなく、また専用の基盤を構築することなく、機械学習のためのデータ解析と予測モデルを迅速に構築できるサービスだとされています。
AWSは、「Amazon Machine Learningは、アマゾンがサプライチェーン管理、不正取引検知、カタログ編成などの重要な機能を実行するために活用してきた機械学習技術と同じものをベースとしている」と説明しています。
このサービスは汎用的な機械学習機能を提供するため、用途は限定されませんが、AWSでは次のような利用例を示しています。
Amazon Machine Learningの利用は、機械学習モデルの構築と、実際のデータへの適用の2ステップに分かれます。
まず訓練データをサービスに読み込ませて解析処理を実行することで、サービスがこのデータからパターンを抽出し、機械学習モデルを自動的に構築します。このモデルの質を評価し、複数の方法でチューニングを加えることもできます。
訓練データは、「Amazon S3」「Amazon Redshift」「Amazon RDS for MySQL」から読み込むことができます。データを読み込ませた後に、これを視覚的に表示し、外れ値を除去するなどの処理が行えます。予測については、二値分類(例:「YesかNoか」「1か0か」)、多値分類(例:「AかBかCか」)、回帰分析(線形分析、例:「どれくらいの値か」)の3種類が選択できます。この一連のプロセスは、データの複製を作り出すわけではなく、抽出されたパターンが機械学習モデルに組み込まれるだけとされています。
次に、機械学習モデルをデータに適用し、予測を実行します。適用方法には、バッチとリアルタイムの2種類があり、それぞれ別のAPIで呼び出して使えます。デフォルトでは、バッチ予測は最大で5つを同時実行でき、リアルタイム予測は、最大で200 TPS(トランザクション/秒)を実行できるといいます。
AWSブログには、Amazon Machine Learningの具体的な利用プロセスが説明されています。このサービスは、Amazon Auroraなどと同じように、ユーザーがAWS上に構築するアプリケーションやサービスの機能を、迅速に強化するためのツールとして使えるところに、重要な特色があります。既存のAWSユーザーに活用される一方、機械学習を適用したサービスを提供したい人々の、AWS利用を促すことでしょう。
「セルフサービスBI(セルフBI)」とも呼ばれる動き、そしてこれに関連する製品・サービスが急速に広がりつつある。一言でいえば、ビジネスを直接生み出す、あるいは直接支える人々が、データを自ら活用し、より迅速で的確な判断をすることを目指す活動だ。
本特集では、セルフサービスBIで具体的に何ができるのか、どうやればいいのか、社内の役割分担はどうすればいいのか、セルフサービスBIツールをどう補うのが効果的なのか、といった、従来のBIとは異なるセルフサービスBIならではの課題と解決策をお伝えする。
Copyright © ITmedia, Inc. All Rights Reserved.