機械学習プロセスを全体的に自動化、Microsoft Igniteで発表の「Automated Machine Learning」とはPower BIにも搭載へ

Microsoftは2018年9月下旬に開催した「Microsoft Ignite 2018」で、機械学習パイプラインを大幅に自動化する「Automated Machine Learning(Automated ML)」を発表した。Microsoft Azureの機械学習サービスであるAzure Machine Learningの一機能として提供される。

» 2018年09月27日 12時45分 公開
[三木泉@IT]

 Microsoftは2018年9月下旬に開催した「Microsoft Ignite 2018」で、機械学習パイプラインを大幅に自動化する「Automated Machine Learning(Automated ML)」のパブリックプレビュー提供を開始したと発表した。Microsoft Azureの機械学習サービスであるAzure Machine Learningの一機能という位置づけになる。なお、Automated MLを使った機械学習の処理プロセスは、ローカルでも実行できる。

「MLパイプラインの自動総当たり」をレコメンデーションエンジンで効率化

 データサイエンティストは、特徴量、アルゴリズム、パラメータのさまざまな組み合わせを使ったトレーニングの繰り返し実行を通じて、最善モデルの選択を行う。Automated MLはこのプロセスを自動化する機能。基本的には、多様な組み合わせを次々に実行していく。

データサイエンティストのこうした繰り返しの作業を減らすことが目標
データ、目標、制約条件を入力することで、アウトプットでは最善なモデルを示す

 現時点では分類および回帰分析に対応。利用できるアルゴリズムは、いずれについてもscikit-learnおよびLightGBMのライブラリで使えるものに限定されている。

 ただし、「総当たり」をしなくて済むようにするため、レコメンデーション機能を備えている。このレコメンデーション機能は、Microsoft Researchが開発した手法を用いて数億回の実験を繰り返して構築した確率モデルに基づくものという。これにより、良い結果を得られそうなアルゴリズム/パラメータは何かを自動的に推測し、これを実行順序に反映させる。これにより、短時間、低コストで機械学習が行えるとする。

 ユーザーは、データの存在場所を指定し、目標(モデルの評価指標、達成したい指標の数値)や制約条件(実行回数、各実行単位の最長処理時間など)を設定すれば、後はAutomated MLに任せることができる。数値目標が達成された時点で、Automated MLによる自動処理は終了する。

評価指標、達成したい評価指標値、実行回数、各実行単位の最長処理時間などを設定する。実行から除外したいアルゴリズムを明示的に指定することもできる
実行結果は、次々に示されていく

 前処理を行うかどうかをTrue/Falseで設定することもできる。Trueに設定すると、欠けている項目の補完や正規化などの作業を自動実行するという。

 Microsoftはこの機能を、同社のBIツールである「Power BI」に組み込む作業を進めているという。これにより、より幅広いユーザーが、PythonやJupyter Notebookを覚えることなく、Power BIのインタフェース上で、既存のデータを使って簡単に機械学習を利用できるようになるとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。