マイクロソフトとCrowdFlowerが、「Human-in-the-loop(人間参加)」型の機械学習サービス「CrowdFlower AI Powered by Microsoft Azure Machine Learning」をリリースした。「Human-in-the-loop」とは何か。
米マイクロソフトと米CrowdFlowerは2016年10月17日(米国時間)、Human-in-the-loop(人間参加)型の機械学習サービス「CrowdFlower AI Powered by Microsoft Azure Machine Learning(以下、CrowdFlower AI)」を発表した。
CrowdFlowerは、データサイエンティスト向けとなるデータのリッチ化および深層学習によるラベリングプラットフォーム「CrowdFlower」を手掛けている。このプラットフォームでは、人間の知的活動で得られた情報を利用してデータのリッチ化とラベル付けができる。新サービスのCrowdFlower AIでは、CrowdFlowerの技術で活用される人間の知的活動と、「Microsoft Azure Machine Learning」による機械学習を組み合わせて、さまざまなHuman-in-the-loop(HITL)型の機械学習ワークフローを実現するという。
CrowdFlower AIはまず、テキスト分類への適用に重点を置く。マイクロソフトは、このサービスで実現できるHITL機械学習の活用例として、以下を挙げている。
HITL機械学習では、機械側で対象作業の大部分を自動化する一方で、機械が対応しきれない場合に人間が補う体制が考慮されている。企業は機械学習の効率と、人間が判断する質の両方の恩恵を受けられる。また、CrowdFlower AIはこれらのテキスト分類処理に加えて、音声処理、画像処理、IoT信号処理といった幅広い分野で適用できるという。
例えば米国郵政公社(USPS)では、郵便物の住所を機械で自動認識できなかった場合には職員が判読する体制となっている。このように人間が機械を補完する作業を含む処理も含めて、包括的なソリューションとして自動化できれば効果はさらに上がりそうだ。しかし、これはとても複雑なプロセスとなる。
郵便物の住所を認識できなかった理由は何か。その状況をどうやって解決するのか。人間ならば経験などから状況判断ができる。しかし、データサイエンティストが、このように例外のシーンを想定した機械学習モデルを作成するのには、多くの時間とコストを要する。また、機械学習の予測が不確実なときにのみオンデマンドで人間が介在することや、機械学習モデルと人間の知見を結ぶことも簡単ではなかった。
マイクロソフトとCrowdFlowerが連携した理由はここにある。マイクロソフトが持つ自動機械学習機能「Cortana Intelligence Suite」とCrowdFlowerを組み合わせれば、そのプロセスを大幅に簡素化できるとする。CrowdFlower AIを利用したプロセスでは、データサイエンティストは全く不要となり、オンデマンドで介在する人間を管理する必要もなくなるという。
マイクロソフトは、企業がHITL機械学習によって生産性向上やコスト削減を見込めるビジネス例として、以下を挙げている。
Copyright © ITmedia, Inc. All Rights Reserved.