AIプロジェクトの成否は「MLOps(機械学習基盤)」にかかっている:2020年、AI活用の成否を分かつ技術とは(2)
人工知能(AI)を活用して価値を提供する企業が現れる中、PoCでつまずく企業が見直すべきポイントはどこにあるのか。そして今後必要不可欠になる考え方とは何か。機械学習に必要な教師データを企業に提供するLionbridgeに話を聞いた。
AI技術を活用して、実ビジネスで成果を獲得している企業が着実に増えつつある。
ごく身近なところで言えば、定額制動画配信サービスで知られるNetflixが挙げられる。同社はレコメンドアルゴリズムに機械学習を活用。その他、機械学習を用いて成功作品の特性を見いだし、Netflixの独自コンテンツ制作に生かしたり、広告素材制作に分析結果を生かして会員獲得増を果たしたりと、AIを実益に結び付けている。
言うまでもなく、こうした事例は同社のようなWeb系企業に限らず、一般的な企業でも表れつつある。特に、もともと分析と相性の良い文化を持つ金融、保険や、製造業におけるAI活用プロジェクトは国内でも盛んだ。
だが、先行事例が注目を集める一方、AIや機械学習(ML)のPoC(概念実証)に取り組んだものの、次のフェーズに踏み出せない企業が少なくないという現実もある。多くの場合、新しいモデルの開発やアルゴリズムのテスト、既存のモデルの分析や解析を行う上でのノウハウや人材の不足、インフラの不備などが主な原因だが、PoC止まりになる最大の原因はそうしたところにはない。
ではAI技術を活用して価値を提供している先行企業との間にはどのような違いがあるのだろうか。今後、AI技術を活用して価値を提供していく上で押さえておくべきポイントとは何だろうか。翻訳事業を主軸とし、「早い段階から機械学習に必要な教師データを提供する」ビジネスを展開しているLionbridgeに話を聞いた。
AI技術のPoCはどう進めるべきなのか
Lionbridgeは、翻訳などのローカリゼーションサービスを展開している。翻訳は、まさに自然言語を処理することだ。同社は、翻訳から発展した自然言語処理関連のサービスとして、学習データ作成サービスを展開。10年以上の実績を持ち、学習データを整備する際の「データアノテーション」に関するノウハウを蓄積している。
「Lionbridgeは、ML技術そのものの開発をしていません。しかし、それを支援するためのサービスを展開しています。学習データの収集や加工、音声認識のための音声合成の支援なども提供しています」と話すのは、ライオンブリッジジャパン AI事業部長 Cedric Wagrez(セドリック・ヴァグレ)氏だ。
ヴァグレ氏は、AI活用に取り組むPoCのきっかけが「データがあるから」という理由だと失敗しやすいと指摘する。
「まずはビジネス課題が何なのかを明確化すべきです。例えば、製造業で製品の品質管理にAIを活用する場合、『1分間に幾つ検査しその精度を90%以上にしたい』など、具体的な目的を決めておくべきです」
目標を定めずに「データがあるから」とPoCを実施した場合、AI技術の有用性は検証できても、「ビジネスの目的に活用できるか」を実証できないという。
「まずはビジネス課題のKPI(重要業績評価指標)を設定します。その上でどのようなAIモデルを作り、どれくらいの予測精度を求めるかを考えるのです」とヴァグレ氏。ビジネスの最終目的を理解してから取り組むことで、AI活用の成功に結び付くという。
例えば、カーナビの音声認識ならば、きれいな音声データで学習させてもあまり意味はない。車内は走行音や振動などのノイズが含まれるため、それを考慮したモデルが必要になるからだ。つまり、最終的なビジネス目的が明らかになっていなければ、集めるべき学習データがはっきりせず、当然ビジネスに有用なモデルは作れないことになる。
学習データをどう作るか――Lionbridgeの場合
Lionbridgeで学習データを作成する際には、ビジネスの最終目的を明確にした上で、顧客ニーズに沿ったデータ品質を定義する。例えば、高速道路の監視カメラ映像から車を抽出したい場合、昼間の明るい映像はもちろん夜間の暗い映像でも車を抽出(認識)しなければならない。つまり、実ビジネスにおいて実現したいことに合致したデータを収集して整備しなければならないのだ。「データを集めて加工するだけでなく、どのようなデータが必要でどの精度に持っていかなければならないのか、それを見極めデータの質、量を決めていかなければなりません」とヴァグレ氏は言う。
他には、一般的な機械学習の課題も熟知している必要がある。例えば、音声認識の際には、子どもの声の認識精度が落ちる課題がある。手書き文字の認識では、左利きの人が書いた文字の認識精度が下がる傾向もある。これらの一般的な機械学習の課題も分かっていないと、適切な学習データの収集と生成は難しいという。
「データアノテーションの一環で写真から車を抽出させるなら誰でもできるかもしれません。しかし、例えば文章の感情分析の判断は人それぞれで1人だけで判断するのは容易ではありません。判断が分かれるようなものは1人で担当するのではなく、複数の人間が判断して結論が一致したデータだけを集めるといった工夫も必要です」
「AIは開発して終わり」という誤解
KPIを設定してデータを収集し、PoCで成果が出たとしても「後はAIを開発して終わり」という考え方に陥ってしまわないようにすることも重要だ。
例えば、先述したような製品の品質管理にAIを適用したとしても、技術の進歩によりセンサーの精度向上でデータの質に変化が起きれば、既存のモデルが適合しなくなる(精度が落ちる)ことが考えられる。ECサイトなら、外的環境の変化が購買に影響を及ぼす可能性がある。一度開発すれば安定して利用を継続できそうな自然言語処理に関するモデルも、時間とともに新しい言葉が登場するため、適宜モデルの調整が必要になる。
「あるデータとパラメーターで学習した結果がどうなったかを全て記録し、いつでも参照できるようにする『データバージョニング』と、何らかの方法で定期的にモニタリングし、予測精度に著しい変化があれば、高い予測精度を維持するための作業が必要不可欠です」(ヴァグレ氏)
モデルの予測精度を向上させるには、データサイエンティストが新たなデータを追加してパラメーターを変えて分析する。これまで利用してきたデータに関する情報が記録、管理されていなければ、比較分析ができず意思決定が難しくなってしまう。
また機械学習を用いた画像認識で高い精度を出すためには、学習データが100万枚を超えることもある。大量のデータで学習する場合、データバージョニングの管理はツールなどを活用し効率的に実施することが求められる。
データサイエンティストを支える環境をどう構築するか
データサイエンティストは自ら学習用データを整備し、「Jupyter Notebook」(関連記事)などを用いてデータ分析と試行錯誤を繰り返して有効なモデルを導き出す。この仕事の裏側には、分析のためのコードの変更管理や、Jupyter Notebookの実行環境の整備、ライブラリの依存関係の管理、テストの実施、モデルのデプロイなど多数の作業が含まれる。
どのように環境を構築するのか、例えばPythonのバージョンはどれを使うか、依存するライブラリは何なのかといった管理作業やバージョンアップデートなどの更新作業は時間がかかる。そして先述したデータバージョニングやモニタリング環境をどう構築、運用するかも考えなければならない。そこで広まっているのが「MLOps」だ。
MLOpsは、機械学習チーム/開発チームと運用チームが互いに協調して機械学習モデルの実装から運用までのライフサイクルを円滑に進めるための機械学習基盤や概念のことを指す。AIを実ビジネスで活用するために、AI技術以外の開発や運用の効率化を考えていこうというわけだ。
「例えば環境構築の問題は『Docker』のようなコンテナ技術を活用することで解決できます」とヴァグレ氏。データサイエンティストの本業であるモデルの整備と、高精度を維持するためのモニタリングなどに注力できるよう、その外縁を開発チームや運用チームが支えていく必要があるというわけだ。機械学習を用いたデータ活用に求められる考え方は、DevOpsで実施するものとよく似ている。
DevOpsの目的は、ビジネス価値を提供するまでのリードタイムを短縮するために、CI(継続的インテグレーション)/CD(継続的デリバリー)や自動化技術を活用し、迅速なアプリケーションの開発、改善と継続的な安定運用を両立して継続させることだ。MLOpsはこれと同様に、データサイエンティスト、開発者、運用者が協調し、モデルの開発、改善と継続的な安定運用を両立させていこうという考え方だ。MLOpsに取り組む上では、DevOpsの背景や目的、DevOpsを支える技術も理解しておくことが必要だ。
目的を明確にしてから取り組み、AIの倫理や説明可能なAIについても考慮する
企業が実ビジネスでAI技術を活用する際に注意すべきなのが、AIの倫理の問題だ。学習するデータに偏りがあれば、仮に精度が高い予測結果が出ても利用すべきではない。
Amazon.comでは、社員採用のレジュメ(履歴書)の評価を機械学習による自然言語処理で実施した結果、応募者の性別で判断するようになったためその仕組みを破棄した。これは学習に利用したデータが男性を優遇するように偏っていたことが原因だ。
今後、機械学習を活用する際には、こうしたデータのバイアス対策も極めて重要となる。この学習データのバイアス問題は、もちろん学習データを収集、作成する際にも意識する必要がある。
このようなバイアスの問題が起きないようにするための取り組みも始まっている。Microsoftが提供する「Microsoft Azure Machine Learning」には、利用するモデルを理解し解釈可能性と公平性の機能でバイアスを排除するものが実装されている。
もう1つ重要なのが「説明可能なAI」だ。機械学習で精度の高い予測ができたとしても、モデルの中身がブラックボックス化してしまうという問題だ。予測精度は高くても、なぜその答えが出るかを説明できないのだ。現場で重要な意思決定を下す際にAI技術を活用する場合は、なぜこのモデルを使い、どうしてその結果になるかの説明ができないと、安心して採用できない。
この「AIの倫理」と「説明可能なAI」は、「Lionbridgeが得意とするデータアノテーションでも、重要な要素になっています」とヴァグレ氏は話す。これらの課題を解決する研究開発は今まさに進んでおり、新しいツールなども続々と登場している状況だ。
AI技術の民主化、そして実ビジネスへ
今日、AI技術に関するさまざまなサービスが登場して利用できるようになっている。AI技術に関するライブラリや周辺ツールがオープンソースで公開されることも珍しくない。
「大手IT企業が機械学習を用いて生成したモデルがAPI経由で利用できるなど、開発者はAI技術をすぐに利用できます。これらの技術を利用するだけで、成果を上げられるケースもあるかもしれません。昨今は、多くの学習データを基に導き出された機械学習モデルを用いて、データを用意できない分野に転用する『転移学習』にも注目が集まっています」(ヴァグレ氏)
PoCに取り組むのは、機械学習を活用するための最初のステップにすぎない。また実ビジネスでAI技術を活用するには予測精度の高いモデルを維持させることを目的に、データサイエンティストや開発チーム、運用チームが協調してMLOpsの実現に向けて取り組む必要もある。「今後、AIがビジネスに大きく影響するのは間違いありません。すぐに利用できるAI技術をぜひ試してみてください。積極的な投資をしない企業はもったいない」とヴァグレ氏はアドバイスするのだった。
特集:2020年、AI活用の成否を分かつ技術とは
Deep Learningがブレークスルーとなった昨今の「第3次AIブーム」。2020年は、企業の「AI」活用において、ブームのままPoC(概念実証)で終わるのか、本番で稼働するシステムやサービスに適用できるのかの分水嶺となるだろう。その成否を分かつものは何なのだろうか。本特集では、現在の機械学習・Deep Learningにおけるさまざまな課題の中でも技術的なものを中心に整理し、その解決策としてAutoML(機械学習自動化)、MLOps(機械学習基盤)といった技術を解説。加えて、それらを活用している企業の事例を紹介する。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- AIは蜃気楼か、ディープラーニングの功罪から新型コロナまで、白熱した議論の中身
ディープラーニングの社会実装で最前線に立つ、丸山宏氏、森正弥氏、石山洸氏、佐藤聡氏の4人の論客が2020年5月、AI/ディープラーニングの現在と新型コロナの関係について戦わせた議論をお届けする。 - Gartnerの「人工知能のハイプサイクル:2019年」が示したAIのトップトレンド
AIに関するGartnerのハイプサイクルレポートは、AIが多種多様な形で企業に導入されていくことを浮き彫りにしている。同報告書は、特に「拡張インテリジェンス」「チャットBot」「機械学習」「AIガバナンス」「インテリジェントアプリケーション」に注目すべきだとしている。 - 2020年の「AI/機械学習」界わいはこうなる! 10大予測
MLOps/AutoMLなどの自動化に、自然言語処理(BERTなど)、倫理問題/信頼と、2019年の「AI/機械学習」界わいの変化は止まらなかった。2020年はどう進化していくのか? 英語での情報を参考に、10個の大胆予測を行う。