検索
連載

2020年の「AI/機械学習」界わいはこうなる! 10大予測AI・機械学習の業界動向

MLOps/AutoMLなどの自動化に、自然言語処理(BERTなど)、倫理問題/信頼と、2019年の「AI/機械学習」界わいの変化は止まらなかった。2020年はどう進化していくのか? 英語での情報を参考に、10個の大胆予測を行う。

PC用表示 関連情報
Share
Tweet
LINE
Hatena
「AI・機械学習の業界動向」のインデックス

連載目次

 本稿には新バージョンがあります。2021年に向けてのアップデート記事(2020年12月28日公開)はこちらです。

 本連載の趣旨は、世の中に埋もれている情報を筆者独自にキュレーションすること(=情報を収集して選び、独自の付加価値を付けてまとめること)である。英語圏では、2019年12月に入り、「AI/機械学習の2020年予測」が数多く公開されている。そこで、本稿ではその内容をキュレーションし、筆者なりに10個にまとめて発表する。

 参考にした記事は、以下のとおり(いずれも英語情報)。

 本稿では、下記の10項目を予想した。

  1. AI/機械学習やデータサイエンスに対する、エグゼクティブ/意思決定層の理解が深まる
  2. AI/機械学習やデータサイエンスの役割分担が進む
  3. MLOpsが浸透し、企業は大きな推進力を獲得する
  4. AI/機械学習の倫理の問題は、さらに大きくなってしまう
  5. AI/機械学習モデルは、説明可能になっていく
  6. AutoMLは大躍進する
  7. 自然言語処理(NLP)がさらに躍進し、活用事例が増えていく
  8. ファイナンス機械学習が一部でブームとなっていく
  9. 強化学習の主要な適用範囲が、ゲームから現実世界の産業分野へ移行する
  10. 5Gのサービス開始により、“AIoT”の事例が徐々に増えていく

 それではさっそく、1つ目から順に紹介していこう。なお、番号順は優先度/可能性順というわけではなく、単に説明しやすい分類/粒度順となっている。

1. AI/機械学習やデータサイエンスに対する、エグゼクティブ/意思決定層の理解が深まる

 AlphaGo(アルファ碁)が人間のプロ棋士に勝って話題になったのが2016年3月だ。それから既に3年以上の時間が経過している。2016年にディープラーニングが注目されたときは、世の中は誤解であふれていた。2018年の段階でも、特にエグゼクティブ/意思決定層のAIに対する過度な期待があった(と筆者は感じている)。それが2019年には、ディープラーニングや機械学習の実例やPoC(概念実証)を経験するうちに、思い描いていたことができないことに気付いたりしていき、AI/機械学習やデータサイエンスの実像にかなり近い理解ができてきている(と筆者は感じている)。この流れは、2019年10月31日にガートナーが発表した「日本におけるテクノロジのハイプ・サイクル:2019年」にも表現されている(図1)。

図1 ガートナーが発表した「日本におけるテクノロジのハイプ・サイクル:2019年」の引用
図1 ガートナーが発表した「日本におけるテクノロジのハイプ・サイクル:2019年」の引用

 図1を見ると、「人工知能」は「『過度な期待』のピーク期」から「幻滅期」に移行した、となっている。2020年はこの流れがさらに進み、AI/機械学習やデータサイエンスの理解が多くの人の中でより深まるだろう。その恩恵として、現実に即した、地に足のついた実例が増えていき、より高度で適切なAI活用が進んでいくと予測している。そして2021年に向けて、「AIファースト」アプローチを採用する企業が徐々に増えていくだろう。この流れに一般的なITエンジニア(ソフトウェア開発者やWeb開発者など)も影響を受け、徐々にAI・機械学習に触れたり学んだりする機会がいや応なく増えていく。

2. AI/機械学習やデータサイエンスの役割分担が進む

 2019年時点では、機械学習エンジニアとデータサイエンティストは名前こそ違うが、そこまで明確に区別されていない(と筆者は感じている)。しかし、学術研究/調査において数学や統計学などの科学知識面から機械学習に関わる「データサイエンティスト」と、大規模システム開発やインフラ構築などのIT分野の技術面から機械学習に関わる「機械学習エンジニア」は、本質的に役割が異なるはずである。ちなみに、@IT/Deep Insiderは機械学習エンジニア向けの情報発信を意識しており、「@IT/Deep Insiderの歩き方」という記事では図2のようなレベル感を提示している。

図2 「AI・機械学習の開発/使用レベル」の引用
図2 「AI・機械学習の開発/使用レベル」の引用

 上記のエグゼクティブ/意思決定層の理解が深まれば、この両者が得意とするスキルセットは異なることの理解も進む。その結果、機械学習に取り組む際の役割がより適切に分担されるようになる。それぞれの専門性はさらに高まるだろう。データサイエンティストは、コンサルティング能力がより求められるようになり、よりビジネスドメインに取り組んで意志決定することが要求されるようになる。一方で、機械学習エンジニアは、最終的に製品リリースまでをスムーズに実施するプロジェクト管理能力がより強く求められるようになるだろう。この役割分担が進むことで、大規模な機械学習システムの開発事例も増えていくことになる。

3. MLOpsが浸透し、企業は大きな推進力を獲得する

 上記の役割分担が進むにつれ、MLOps(機械学習基盤)体制(図3)やML(機械学習)パイプラインの構築もより重要視されるようになる。

図3 「MLOpsのイメージ」の引用
図3 「MLOpsのイメージ」の引用

 2019年は、例えばNetflixやメルカリなど、最先端を走るIT企業がMLOpsを採用して、その手法を公開した。2020年は、さらに多くのIT企業がMLOpsを採用して、その事例が公開されていき、さらにMLOpsのノウハウが増えていくことになる。2021年に向けて、MLOpsの流行に伴い、大企業での採用時例もチラホラと出始めると予想する。それが、各企業におけるAI/機械学習プロジェクトの推進に大いに役立つことになる。

 また、MLOpsに関連するツールの活用も広がる。例えば、

といった、機械学習モデルの構築〜トレーニング〜デプロイを行えるツールが存在するが、こういったツールがMLOpsを支援するツールとして実際のプロジェクトで活用されていくだろう。その一方で、「どのツールを使うべきか」という競争が生まれ、2021年に向けて競争は熾烈(しれつ)を極めていく。

4. AI/機械学習の倫理の問題は、さらに大きくなってしまう

 2019年12月には、公平性の問題(図4)、つまり不公平なバイアスに基づき学習した機械学習モデルが不当な差別(人種差別/民族差別や、性別差別、文化差別/地域差別など)を引き起こすケースに注目が集まり、大きな議論になった。

図4 「公平性のイメージ」の引用
図4 「公平性のイメージ」の引用

 プライバシーや偏見、人権、差別に関わる倫理的な社会問題は、2020年も引き続き、勢いを増して発生することになるだろう。その一方で、倫理問題に対処する機運は高まり、明確な規律や対処方法がさまざまな形で登場してくるはずだ。

5. AI/機械学習モデルは、説明可能になっていく

 AI/機械学習システムが社会で活用されるにつれ、そのAIを提供する企業は、透明性や信頼性、説明可能なAI(XAI:Explainable AI)/解釈可能性(図5-1)が求められるようになってきている。この傾向は、2020年も継続するだろう。

図5-1 「ブラックボックス(左)は通常のAIのイメージで、ホワイトボックス(右)が説明可能なAIのイメージ」の引用
図5-1 「ブラックボックス(左)は通常のAIのイメージで、ホワイトボックス(右)が説明可能なAIのイメージ」の引用

 また、説明可能なAIを実現するための技術はさらに進化していくだろう。例えば2019年の時点で、DataRobotでは「どの特徴量がどれくらい結果に作用するか」を可視化することができる(図5-2)。

図5-2 DataRobotにおける「特徴量ごとの作用」
図5-2 DataRobotにおける「特徴量ごとの作用」

 各クラウドプラットフォームでも、同様の「機械学習モデルの解釈可能性を示す機能」が提供され始めている。例えば、

といったツールが既に提供されており、2020年は説明可能なAI/解釈可能性の機能が充実してくる。また、その研究も盛んで、その傾向は2020年、さらに強まっていく。それに伴い、こういったツールの活用も徐々に増えていき、より一般社会にAI・機械学習を導入しやすい雰囲気が広がっていくと予想している。

6. AutoMLは大躍進する

 AI/機械学習で大変なのは、適切なモデルを選んだり、ハイパーパラメーターを少しずつ変えながら試行錯誤したりすることである。Pythonコードを工夫することで、ある程度の自動化はできるといっても、最初からAutoML(=自動化された機械学習)機能がツールやクラウドサービスで提供されている方が便利である。

 AutoML機能をいち早く提供していたDataRobotでは、数千のアルゴリズムから約30〜70個のモデルを選別して自動的に学習を進め、その結果を精度ごとに自動的に並べ替えるオートパイロット機能がある(図6)。

図6 DataRobotのオートパイロット機能の利用画面
図6 DataRobotのオートパイロット機能の利用画面

 このようなAutoML/オートパイロット機能は、2019年末時点の各主要クラウドプラットフォーム上では、下記のサービスなどが提供されている。

 ちなみに、既存の学習済みモデルを「転移学習」によってカスタマイズする機能を、グーグルは「Cloud AutoML」と呼んでいるので注意してほしい。同様の転移学習/カスタマイズ機能は、AzureのCognitive Servicesや、AWSのAIサービスでも提供されている。

 2020年、AutoML/オートパイロット機能は利用者から多くのフィードバックを得ながら徐々に機能改善や新機能提供がなされていくだろう。高額だが高機能なDataRobotに対して、各クラウドプラットフォームのAutoML機能はシンプルだが比較的安く利用できる。今後、より広くAutoML機能が活用され、事例が増えていくと予測する。「データサイエンスや機械学習の民主化が本格的になった」とメディアも大騒ぎすることになるだろう。

 しかし、事例が増えるにつれて、AutoML/オートパイロット機能の課題も見えてくるようになる。2021年に向けて、最終的なモデルの選別や意志決定にはデータサイエンティストが関わるべきという論調が増えていき、2でも述べたようなデータサイエンティストとしての役割分担が重要視されるようになっていくだろう。特にビジネスドメイン知識の大切さが叫ばれ始めるだろう。

7. 自然言語処理(NLP)がさらに躍進し、活用事例が増えていく

 ディープラーニングといえば、「画像認識」「画像生成」「音声認識」「音楽生成」などで顕著な成果を出してきたが、「自然言語処理(NLP:Natural Language Processing)の認識/生成」では「人間を超える」と言ってよいほどの成果は出せていない(と筆者は考えている)。@IT/Deep Insiderでも自然言語処理の認識(予測)生成の記事があるが、「確かに面白いが、精度は期待したほどではないな」というのが筆者の感想であった。

 それが、2018年10月に「BERT」という手法をグーグルが論文で発表してから変わっていくことになる。2019年はBERTが大きく注目された年となった。一番盛り上がったのは、2019年10月にグーグルが「Google検索エンジンにBERTを導入して、クエリの理解度が大きく向上した」と発表したことだろう。これにより、一般人にも「BERT」という名前が広まっていった。

図7 「BERTにおける事前学習と事後学習の処理」の引用
図7 「BERTにおける事前学習と事後学習の処理」の引用
引用元: Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. Bert: Pretraining of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805, 2018.

 BERTの登場により、自然言語処理の分野は活性化している。例えば、2019年2月に「高性能すぎて危険」というキャッチコピーで知られる「GPT-2」という手法をOpenAI(非営利の研究グループ)が論文で発表し、2019年11月にその最終版がリリースされている。自然言語処理の分野では、このような新たな躍進が2020年も続くのは間違いないだろう。2020年中には、翻訳や会話など、身の回りの言語関連製品がより高精度/高性能になっていくと予測する。

8. ファイナンス機械学習が一部でブームとなっていく

 機械学習を始めた人の多くが一度は、「株やFX、ビットコインなどの値上がり/値下がりを予測して、売買益を得たい」と考えたことがあるのではないだろうか。しかしご存知の通り、株価などの推移は、複雑な要因や人間の思惑により形成されるものなので、現実的には機械的な予測はかなり難しい。その分野で何年も研究開発してきた人から「無理です」という発言を筆者は聞いたこともあるし、実際にやってみると「丁半博打よりはマシかな」程度の結果しか得られないことがほとんどではないだろうか。何より、金融(Finance)分野で機械学習を活用するための手法(以下、ファイナンス機械学習)*1を「基礎から本格的に」かつ「学術的に」学べる情報が少ない(と筆者は感じている)。

*1 なお、「ファイナンス機械学習」=「金融工学(Financial Engineering)分野における機械学習(Machine Learning)」には、もちろん株価などの推移の予測だけではなく、貸し倒れ率の予測といった信用リスク評価から、クオンツ運用(=投資のポートフォリオを自動的に組んで運用すること)を行うロボアドバイザーまで、さまざまなものがある。


 その状況に変化を筆者は感じている。最近の2019年12月に入って、ファイナンス機械学習に関する情報が増えてきているのだ。具体的には、『ファイナンス機械学習―金融市場分析を変える機械学習アルゴリズムの理論と実践』(12/24販売開始)、『TensorFlowではじめる 株式投資のためのディープラーニング』(12/17販売開始)、『Pythonによるファイナンス 第2版』(12/26販売開始)といった書籍が次々と販売開始されたり、動画学習サイト「Coursera」でも『Machine Learning for Trading』(12/24開始)というコースが新設されたりしている。

図8 続々と登場する「ファイナンス機械学習」関連の学習教材
図8 続々と登場する「ファイナンス機械学習」関連の学習教材

 2020年はこの情報増加の流れが継続して、さらにファイナンス機械学習の活用事例やノウハウが公開されていくだろう。機械学習エンジニアやデータサイエンティストの一部ではあるものの、多くの人がファイナンス機械学習に触れていく中で知見が蓄積されていき、ファイナンス機械学習のさまざまな実装が徐々に増えていく。

9. 強化学習の主要な適用範囲が、ゲームから現実世界の産業分野へ移行する

 強化学習(RL:Reinforcement Learning)は、AlphaGo(アルファ碁)に代表されるように、ディープラーニングの成果を世に知らしめた重要な学習方法である。しかし2019年になっても、ゲームでの活用成功例が報道されるばかりなので、「箱庭(=ゲームのような制限された環境と条件下)でしか役立たない技術」という印象がいまだに拭えない。

 しかし本来、強化学習は、自動運転や産業用ロボット、ドローンなどとの親和性が高い技術である。実際に、日本の自動車産業(トヨタなど)やロボット産業(ファナック:FANUCなど)は、Preferred Networks(プリファードネットワークス。以下、PFN)と協力して、(強化学習を含めて)機械学習の研究や実装を進めている。そのPFNは、12月に入って、自社のディープラーニングライブラリ「Chainer」の開発を終了して、「PyTorch」に移行することを発表した。これについては、PFN代表の西川徹氏は、図9のようにコメントしている。

図9 「PFN代表の西川徹氏によるPyTorch移行に関するコメント」の引用
図9 「PFN代表の西川徹氏によるPyTorch移行に関するコメント」の引用
引用元: 「Preferred Networks、深層学習の研究開発基盤をPyTorchに移行 | 株式会社Preferred Networks

 Chainerといえば、その強化学習版である「ChainerRL」の人気が日本では高い。その人気や実力は、PyTorchに移行して開発リソースを集中できるようになることで強化されるだろう。2020年、日本ではPFNを中心に深層強化学習を活用したソリューションが次々と登場し、強化学習に対する人々のイメージが「箱庭ゲーム」から「産業ロボットなどの現実世界の産業分野で使うもの」へと変わっていく。根拠は弱いが、期待も込めて、このように予想したい。

10. 5Gのサービス開始により、“AIoT”の事例が徐々に増えていく

 いよいよ10個目である。最後は5G(第5世代移動通信システム)を絡めて予想したい。

 2020年3月以降、日本でも各社から5Gサービスが提供開始される。5Gになると、モバイル端末やエッジデバイスがインターネット経由で扱える情報量が爆発的に増加する。そうなると、従来のIoT(モノのインターネット化)では考えられなかった新種のサービスが次々と登場するようになる可能性がある。そこでは、大量のデータを必要とするAIを組み合わせた「AI+IoT」、すなわち“AIoT”も同時に躍進するだろう。AIoTにより、さまざまな社会課題が解決されるとともに、AI/機械学習が一般の消費者にさらに身近な存在となっていく。

 AIoTの事例が増えるにつれて、エッジデバイス上の機械学習モデルによる推論のリアルタイム性(=高速化)と低電力化に対するニーズがさらに高まる。これに応じて、エッジデバイスのAIチップ(=ディープラーニングのアクセラレータ)も競争がさらに熾烈になっていく。既に、2017年登場のIntel Movidius、2018年登場のグーグルEdge TPU、2019年登場のエヌビディア(NVIDIA)Jetson Nano(図10)などと、他にも数多くのAIチップが存在し、既に競争が発生している(詳しくは「エッジAI史 【AIチップ年表付き】 〜エッジAIは今ここまで進んでいる〜|Marina Sakaguchi|note」を一読するのがお勧め)。今後は「他のスタートアップ企業や、中国のアリババやバイドゥ、ファーフェイなどが、どれくらいエッジAIでシェアを取れるか」が注目される。予想は難しいが、2020年は依然として競争が続きつつも、特にJetson Nanoは力強くシェアを伸ばすだろう。

図10 Jetson Nanoのパッケージ写真
図10 Jetson Nanoのパッケージ写真


 以上、キュレーションと筆者の実感を基に、10個の大予測をしてみた。この内容に賛成できる/できない、などの意見や感想もあると思うが、あくまで年末最後を記念した占い的な記事に過ぎない(ざっくりとした根拠しかない)ので、その点は差し引いて捉えていただきたい。

 2019年の皆さんのご愛読に感謝したい。2020年もDeep Insiderは、機械学習エンジニア向けの記事を展開していく予定である。ぜひ来年も引き続きのご愛読をお願いしたい。

「AI・機械学習の業界動向」のインデックス

AI・機械学習の業界動向

Copyright© Digital Advantage Corp. All Rights Reserved.

[an error occurred while processing this directive]
ページトップに戻る