機械学習の主な手法、「教師あり学習」「教師なし学習」「強化学習」はどう違うのか：Gartner Insights Pickup（173）

人工知能（AI）の取り組みにおける機械学習の主な手法として、「教師あり学習」「教師なし学習」「強化学習」がある。3つの機械学習手法それぞれの、ユースケースとベストプラクティスを理解しよう。

» 2020年09月04日 05時00分公開

[Meghan Rimol, Gartner]

ガートナーの米国本社発のオフィシャルサイト「Smarter with Gartner」と、ガートナーアナリストらのブログサイト「Gartner Blog Network」から、＠IT編集部が独自の視点で“読むべき記事”をピックアップして翻訳。グローバルのITトレンドを先取りし「今、何が起きているのか、起きようとしているのか」を展望する。

　不正検知から画像認識、自動運転車まで、機械学習（ML）と人工知能（AI）は、あらゆる産業に革命を起こそうとしている。両者の組み合わせにより、われわれがデータを扱い、活用してデジタル成長を実現する方法が変わりそうだ。

　機械学習は人工知能の下位領域であり、マシンが明示的なプログラミングに従うのではなく、データ内のパターンを識別することで問題解決モデルの構築を可能にする。機械学習ではアルゴリズムがデータ内のパターンを識別し、そのパターンを使ってモデルを微調整し、毎回、より精度の高い出力の提供を目指すというトレーニングプロセスを指す。機械学習の主な手法には、「教師あり学習」「教師なし学習」「強化学習」がある。

　「今のところ、機械学習によって得られる経済的価値の大部分は、教師あり学習のユースケースから生まれている」と、Gartnerのアナリストでシニアディレクターのサーニエ・アライビエ（Saniye Alaybeyi）氏は語る。

　「だが、一部の問題には、教師なし学習の方が適している可能性がある。例えば、エンティティをクラスタリングしようとしていて、ラベル付きデータが利用できない場合がそうだ。また、強化学習も、企業での導入例はまだ限られているが、優れた精度とターゲティングは将来有望だ」（アライビエ氏）

　アライビエ氏は、企業のAIプログラムで使用されるこれら3種類の機械学習と、それぞれが解決できるビジネス課題について、次のように解説している。

教師あり学習

　2022年まで、教師あり学習は、企業のITリーダーが最も利用する種類の機械学習であり続ける見通しだ。不正検知や販売予測、在庫最適化など、教師あり学習はさまざまなビジネスシナリオで効果を発揮する。

　教師あり学習は、既知の過去の入力データと出力データを機械学習アルゴリズムに与えることで機能する。アルゴリズムは各ステップにおいて、入力と出力の各ペアを処理した後で、望ましい結果にできるだけ近い出力を生成するようにモデルを変更する。

　例えば、数千件の銀行取引データを、取引ごとに「詐欺である」「詐欺ではない」のラベルを付けてモデルに渡せる。モデルは、「詐欺である」出力または「詐欺ではない」出力のパターンを識別する学習を重ね、時間の経過とともに、与えられた取引が詐欺かどうかをより正確に予測できるようになる。

　入力データと出力データは、過去のデータやシミュレーション、人手によるデータラベリングから得られる。非構造化データ（画像、ビデオ、オーディオ、テキストのような）を含む場合は、特定のプロパティや分類が出力データとなる。教師あり学習は、予測、データ認識、データ分類に利用できる。

　教師あり学習のユースケースには、以下のような例がある。

病気と予防対策計画のリスクファクターを特定する
電子メールがスパム（迷惑メール）かどうかを判定する
住宅価格を予測する
人々が特定の候補に投票するかどうかを予測する
ローン申込者への融資リスクの高低を判断する
産業機器の機械部品の故障を予測する

教師なし学習

　教師なし学習は、ラベル付けされた過去の応答がない入力データから、予測モデルを作成するのに使われる。例えば、顧客リストやラベル付けされていない写真セットなどが、教師なし学習のユースケースで入力データとなる。

　教師なし学習の最も一般的な応用として、クラスタリングと関連解析が挙げられる。クラスタリングでは、色など特定のプロパティに基づいてオブジェクトをグループ化するモデルを作成する。関連解析は、それらのクラスタ間に存在するルールを特定する。

　教師なし学習のユースケースには、以下のような例がある。

顧客を購入行動によってグループ化する
顧客データにおける関連を特定する。例えば、特定のスタイルの靴を買う人は、特定のスタイルのバッグに興味を持つ可能性がある
人々をさまざまな興味や関心に基づいて分類する
在庫を製造指標や販売指標によってグループ化する

　また、教師なし学習は、教師あり学習用のデータを準備するのに利用できる。これは、データの次元を分類、圧縮、削減するのに使えるパターンや特徴を特定することで行われる。

強化学習

　強化学習は、望ましい行動に報酬を与えたり、望ましくない行動に罰を与えたりすることで成り立つ。強化学習のアルゴリズムは、1つの入力が1つの出力を生成するのではなく、さまざまな出力を生成する。だが、特定の変数を基に、適切な出力を選択するようトレーニングされる。例えば、ビデオゲームで他のプレイヤーより高得点になる行動パターンを特定し、勝つようにコンピュータプログラムをトレーニングできる。

　強化学習は数十年前から存在するが、このところ新たな関心を呼んでいる。教師あり学習よりも管理負担が少ないため、ラベルなしデータセットを扱いやすいからだ。ゲーム分野で最近、強化学習の導入が進んでいる。だが、強化学習の実用的な応用が現れるのはこれからだ。

　現在のほとんどのデータサイエンスプラットフォームや機械学習プラットフォームは、ネイティブな強化学習機能を備えていない。強化学習の実行に必要なコンピューティングパワーは、ほとんどの企業で利用可能な量よりもはるかに大きい。強化学習は今のところ、完全にシミュレーションできる分野、かなり変化がない分野、膨大な関連データが利用できる分野にしか適用できない。

　強化学習のユースケースには、以下のような例がある。