もはやPoCばかりやっている場合ではない――企業が抱くAIへの誤解と課題：特集：2020年、AI活用の成否を分かつ技術とは（1）

Deep Learningがブレークスルーとなった昨今の「第3次AIブーム」。2020年は、企業の「AI」活用において、ブームのままPoC（概念実証）で終わるのか、本番で稼働するシステムやサービスに適用できるのかの分水嶺（れい）となるだろう。その成否を分かつものは何なのだろうか。本特集では、現在の機械学習・Deep Learningにおけるさまざまな課題の中でも技術的なものを中心に整理し、その解決策としてAutoML（機械学習自動化）、MLOps（機械学習基盤）といった技術を解説。加えて、それらを活用している企業の事例を紹介する。初回は、日本ディープラーニング協会の理事に、2020年現在のAI活用における課題について聞いた。

» 2020年05月29日 05時00分公開

[高橋睦美，＠IT]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　あらゆる分野で活用が広がる人工知能（AI）技術。中でもDeep Learning（以下、DL）は画像処理や映像処理での活用に始まり、Googleが2018年10月に発表した「BERT」をきっかけに、自然言語処理（NLP）分野でも進化が進むなど、できることは日々広がっている。こうした技術を企業がビジネスに活用していく際に直面する課題とは何だろうか。ABEJAの代表取締役兼CEOであり、日本ディープラーニング協会（JDLA）の理事を務める岡田陽介氏に聞いた。

技術的な課題よりも、AIに対する「根強い誤解」が課題に？

ABEJA 代表取締役兼 CEO
日本ディープラーニング協会理事
岡田陽介氏
（写真提供：ABEJA）

　今やさまざまなメディアで「AIを活用すべき」「機械学習（以下、ML）やDLを生かした新しいビジネスを」といった論調が飛び交っているが、自社でどのように取り入れ、実践すべきか、思い悩む企業は少なくないのではないだろうか。岡田氏によると、データやテクノロジーの活用を考える際にまず重要なのは、「企業が何を実現したいか」だ。実現したいことによって、使うべきテクノロジーもデータも変わってくる。しかし、「何でもいいのでAIを活用したい」と、本来は手段であるテクノロジー導入を目的化してしまうケースは多い。

　また、企業の間にはAIに対する根強い誤解があるという。「しばしば『AIって、一度作ってしまえばそれをずっと使えるんですよね』と言われる。AIの導入を、単なるツールの導入として捉えている企業はいまだに多い。だがそれは違う。構築直後はAIが期待されたレベルのタスクをこなせないことも多く、サイバー空間上でAIを継続的に運用・改善していくことによってはじめて、AI導入の本当のメリットを享受できるようになる」（岡田氏）。

　「導入して一部が効率化されて終わり」という考えで取り組みを終えるのではなく、継続的な改善サイクルを回し続けることによってAIはその真価を発揮するのである。

モデル開発のサイクルだけではなく、幅広い概念を含む「MLOps」

　データの習得、学習、再学習など、企業で継続的に機械学習を活用し続けるために、提唱されているのが「MLOps」だ。「MLOps」とは、「Machine Learning」と「DevOps」を組み合わせた造語言葉で、MLをビジネスで円滑に利用するために行われる活動やそのための基盤の総称として使われると岡田氏は説明した。一度モデルを構築してそれで終わりにせずに、データの見直しや更新、再学習を続けながら、モデルの精度を維持・向上していくためにMLOpsが必要なのだ。

　MLのモデル（教師あり学習の場合）を開発する際には、まず多くのデータを集め、データラベリングなどの前処理を行い、教師データを作成することになる。そして、この教師データをMLモデルに学習させ、精度を検証する。十分な精度が得られた段階で本番環境にデプロイしていくが、プロセスはここで終わりではない。本番環境にデプロイしたモデルに再学習をかけることによって、フィードバックのサイクルを回していく必要がある。

　こうしたフィードバックサイクルを回すためには、ログ解析やモニタリングといった周辺システムも不可欠だ。岡田氏によると、MLOpsは、こうした一連のシステムとサイクルを含めて考えなければならないという。

　加えて、MLOpsを効率的に回していくには、さまざまなツールやアプローチが必要になる。

　例えば、MLOpsの中で一部の判断や制御を人間が担う「Human in the loop」（人間参加型機械学習）は注目されている概念の一つである。「数年前から、PoC（概念実証）に取り組んでも実装に行き着かず、終わりの見えないPoCを繰り返す『PoC貧乏』や『PoC地獄』が指摘されるようになった。その原因の一つとして、最初から高水準の精度を求めてしまうことが挙げられる。例えば、検品作業をAIで完全に自動化しようとすると、99％以上の確率で欠品を見つけ出す精度が求められてしまう。ある程度の精度が出るようになったら、人間がAIの精度を補いながら、早期に運用をスタートすることを推奨している。そうして、AIの学習に必要なデータを蓄積、そのデータを再学習に回す、ということを繰り返す。これだけでモデルの精度が上がるわけではないが、適切にサイクルを回すことで精度向上が期待できるからだ」（岡田氏）。

　こうした、継続的な改善プロセスを回すためにはモデルを監視し、フィードバックをするための仕組みが必要だという。

　「どのデータを使って、どのモデルを学習させたのか。そして生成されたモデルのバージョンが幾つで、本番システムに適用したときにどんな振る舞いをしたかといったフィードバックが必要になる。こういった事柄がばらばらに管理され、パイプラインがしっかり回らなければ、MLOpsとして使い物にならない」（岡田氏）

継続的学習のためのMLパイプライン（出典：MLOps: Continuous delivery and automation pipelines in machine learning）

　このように、企業が本番運用でMLを活用するには、モデルそのものだけを考えるのではなく、モデルの継続的改善を支える仕組みも含めて整備することが非常に重要であることを岡田氏は強調した。

　モデルの学習から運用、再学習まで一貫して支援をする「ABEJA Platform」でMLOpsを支援してきた立場としても、MLOpsがないと、MLは話にならないという。

　「PoCで作成したモデルを本番環境に組み込んだとき、想定外のデータが来れば来るほど、データパターンが分散することによって学習のパターンも広がる。これに対応できるのかどうかがモデルの精度向上につながる」（岡田氏）。こうした「想定外」を学習させ続けることによって、精度をどんどん向上させていくプロセスが極めて重要であり、それなしにMLの価値をビジネスに最大限に生かすことはできないという。

MLOpsの実践に欠かせないのはリテラシーを備えた各レイヤーの「人材」

　岡田氏は、「MLやDLのソフトウェアを完成品だと思っている企業は多いが、それは違う。私は、このMLOpsという概念は工場の改善プロセスに近いと考えている」と述べた。

　工場の生産プロセスは企業それぞれに異なり、現場の創意工夫や市場の動向を反映しながら随時改善されている。「MLOpsという概念は、こうした工場のプロセスと似ている。工場のプロセスを改善するのと同じように、地道な活動を積み重ねることでMLのプロセスを改善するという気概でやるとうまくいくのではないか」と岡田氏は語り、その意味で、日本企業の得意分野にできる可能性があるとした。

　ただ、そこで欠かせないのが「人」と「組織」だ。

　近年、MLモデルの設計・構築を簡略化する「AutoML」が注目されている。今後、AIモデルを効率的に、自動的に学習する仕組みとしてのAutoMLは進化していくだろうが、それだけでMLOpsが完結するわけではない。

　確かにAutoMLが広がれば、MLOpsにおけるパイプラインの一部は簡略化できる。それほどデータサイエンスやMLに関する知識を持たない人でも、データがあればノンコーディングでMLモデルを構築することができる。

　だが、「それでデータサイエンティストやエンジニアが不要になるわけではない。AutoMLでできるのはあくまで簡易的なことだけであり、複雑なものを作ろうとすればするほど、知識を備えたデータサイエンティスト、MLエンジニア、データエンジニアの役割が重要になってくる。自動化できるところは機械に任せる一方で、複雑な部分に関しては専門家が必要になる」（岡田氏）。

　また、優れたエンジニアをそろえるだけでも不十分だ。業務プロセスにMLを落とし込むにはMLOpsが不可欠であることを理解し、データサイエンティストやエンジニアと連携しながらプロセスを回していく人、さらには、そういった人材の価値を理解し、事業における必要性を理解した上で組織や人事制度を整備する経営層など、さまざまなレイヤーにテクノロジーを理解した人材が必要になるという。

　一つの例が、「ダイキン情報技術大学」を設置し、100人規模でAI・IoT人材の教育、育成に取り組んでいるダイキン工業だ。「テクノロジーをビジネスに活用するために人材の重要性を理解し、ここまで腰をすえて取り組んでいる企業はなかなかない」と岡田氏はその取り組みを称賛している。

PoCフェーズはもう終わり、AIをビジネスで使いこなすためにもMLOpsの構築を

　岡田氏は、最後にこれまでの話をまとめて次のように話す。

　「MLのモデルを作るとか、再学習させるとか、ミクロな事柄は氷山の一角であり、MLOps全体を理解してビジネスレベルで使いこなしていくべきフェーズに来ている。これまでのようなPoC止まりのAI開発は終わりにすべきだ。開発したAIのモデルを運用し、利益を生むフェーズになってきている」

　MLを生かし、MLOpsを回し、データサイエンティストやエンジニアの価値を最大限に高めていくには、多大な労力と適切なプロセス、人の必要性を理解した上で、企業として体制を作り、人を生かす仕組みを作っていかなければならない。こうした「グランドデザイン」を描くことが、MLOpsのプロセスを効果的に作り込み、企業の競争力の源泉になっていく。ひいては、日本企業の姿を変えていくことになるだろうと岡田氏は提言した。

特集：2020年、AI活用の成否を分かつ技術とは

Deep Learningがブレークスルーとなった昨今の「第3次AIブーム」。2020年は、企業の「AI」活用において、ブームのままPoC（概念実証）で終わるのか、本番で稼働するシステムやサービスに適用できるのかの分水嶺となるだろう。その成否を分かつものは何なのだろうか。本特集では、現在の機械学習・Deep Learningにおけるさまざまな課題の中でも技術的なものを中心に整理し、その解決策としてAutoML（機械学習自動化）、MLOps（機械学習基盤）といった技術を解説。加えて、それらを活用している企業の事例を紹介する。

特集：2020年、AI活用の成否を分かつ技術とは

2020年の「AI／機械学習」界わいはこうなる！　10大予測
MLOps／AutoMLなどの自動化に、自然言語処理（BERTなど）、倫理問題／信頼と、2019年の「AI／機械学習」界わいの変化は止まらなかった。2020年はどう進化していくのか？　英語での情報を参考に、10個の大胆予測を行う。
Gartnerの「人工知能のハイプサイクル：2019年」が示したAIのトップトレンド
AIに関するGartnerのハイプサイクルレポートは、AIが多種多様な形で企業に導入されていくことを浮き彫りにしている。同報告書は、特に「拡張インテリジェンス」「チャットBot」「機械学習」「AIガバナンス」「インテリジェントアプリケーション」に注目すべきだとしている。
なぜデータ基盤を作ったのか？「ゼクシィ縁結び・恋結び」で必要になった理由
「ゼクシィ縁結び・恋結び」の開発現場において、筆者が実際に行ったことを題材として、「データ基盤」の構築事例を紹介する連載。初回は、サービスの概要とデータ基盤が必要になった理由について。