2021年の「AI/機械学習」はこうなる! 5大予測:AI・機械学習の業界動向
2020年は、自然言語処理(NLP)のTransformer技術に基づくBERT/GPT-3や、画像生成のディープフェイクが大注目となる一方で、倫理に関する問題がさまざまな方面でくすぶり続けた。2021年の「AI/機械学習」界わいはどう変わっていくのか? 幾つかの情報源を参考に、5個の予測を行う。
年末なので、昨年2019年の記事(半分以上は当たっていたのではないかと思う)に続き、来年2021年向けの「AI/機械学習の予測」をしてみようと思う。とはいっても、未来を予言できるほどの情報力も自信も筆者にはないので、昨年と同じ「人のふんどしスタイル」で以下のサイトからの情報源を大いに参考として、筆者なりの考えをまとめてみる。
- InformationWeek: Predictions for AI in 2021
- WebBigData : AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測リサーチ編
- Forbes: 10 AI Predictions For 2021
- Forbes: Artificial Intelligence (AI): What’s In Store For 2021?
- KDnuggets: AI, Analytics, Machine Learning, Data Science, Deep Learning Research Main Developments in 2020 and Key Trends for 2021
本稿では、下記の5項目を予想した。今年はコロナ禍のせいか情報源や情報量が少なかったので、昨年の10項目から半分に減らした。
- 自然言語処理(NLP)に革命を起こした手法「Transformer」の利用領域がさらに拡大する
- ディープラーニング以外の機械学習関連技術に対する認知と利用が広がる
- AI/機械学習の倫理問題はさらに大きくなり、データとプライバシーの規制が強化される
- MLOpsはさらに成長し、採用する企業が増えていく
- エッジAIが普及し、エッジデバイスでの機械学習関連処理が当たり前になる
それでは早速、1つ目から順に紹介していこう。なお、番号順は優先度/可能性順というわけではなく、単に書いた順である。
1. 自然言語処理(NLP)に革命を起こした「Transformer」の利用領域がさらに拡大する
昨年2019年は「自然言語処理(NLP)がさらに躍進し、活用事例が増えていく」と予測したが、まさに2020年はNLPの年だったと誰もが実感しているのではないだろうか。その躍進の根源となる技術がTransformerである。Transformerベースである「BERT」や「GPT-3」という単語をニュースでたびたび聞いたはずだ。
TransformerはNLPにとどまらず画像認識にまで革命をもたらそうとしている(参考:「画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita」)。この動きはまだまだ始まったばかりと思われるので、2021年も続き、大きな成果が続々と得られるのではないかと筆者は予測している。
一方で、TransformerベースのNLPモデルは肥大化の一途をたどっているという問題がある。例えば2019年のGPT-2ではニューラルネットワークのパラメーター数が15億個だったのに対し、2020年のGPT-3では1750億個と急激に増加した。2021年には1兆個超えを予測する人もいるが、実際にはどうなるだろうか。既にパラメーター数が多すぎてこのレベルになると個人や小さな会社では、新規に学習することなどはかなり難しい。そのこともあり、より小さなモデルで同様の性能を実現できないかと考える研究者も増えてきているようである。そのこともあり2021年は、2020年ほどTransformer一辺倒にはならず、何かしら新しい技術が出てくるのではないかと筆者は期待している。いずれにしも、2021年もNLPは花形の分野であり続けることは間違いないだろう。
2. ディープラーニング以外の機械学習関連技術に対する認知と利用が広がる
昨年2019年まではPyTorchやTensorFlowといったディープラーニングライブラリに大きな注目が集まっていた。2020年は、JAXという自動勾配(Autograd)とXLA(線形代数用コンパイラ)のライブラリが登場し、つい先日、DeepMind社内のプロジェクトでJAXの利用を拡大していることがブログで公表された。2021年は、こういったディープラーニングだけに絞らない、より汎用(はんよう)的なライブラリの活用が広がる可能性があるだろう。
また2020年は、確率的プログラミング言語(PPL)のPyroやTensorFlow Probabilityが紹介される場面が多かった(という印象が筆者にはある)。この傾向は2021年も続き、ベイズモデリングなどの情報もネットや書籍などで増えていくのではないだろうか。いずれにしても、機械学習の中でもとりわけディープラーニング一辺倒だった雰囲気はやや崩れかかっており、2021年はこれに拍車がかかると予測している。
3. AI/機械学習の倫理問題はさらに大きくなり、データとプライバシーの規制が強化される
昨年も「AI/機械学習の倫理の問題は、さらに大きくなってしまう」と書いたが、倫理的な問題はディープフェイク(=顔を変える技術)や、データセットに含まれるデータの公平性(例えば白人ばかりなど)、最近ではAI倫理研究者がグーグルに解雇された件など、さまざまな方面で常に話題になっており、昨年の予測は完全に当たったといえるだろう。AIの研究や利活用が進めば進むほど、隠れていた問題があらわになりやすいと考えられるので、2021年も2020年と同様に何らかの倫理問題のニュースが常に流れ続けるだろう。
それに伴い、データやプライバシーに対する規制を強化する動きが見られるのではないかと予想している。2021年はバイデン氏が新たな米国大統領として就任する。中国との競争でAIに関する政策は強化されるだろうが、その一方で(前任者の悪い点を徹底的に追究するためにも)人種問題などの差別を含むデータやプライバシー問題に強い規制をかける可能性があるのではないかと見ている。そうなると、日本の政府もそれに追従する可能性がある。最近では連合学習(Federated Learning)と呼ばれるプライバシーに配慮したデータ管理手法も考案されており、2021年にはそういったプライバシー関連の技術が発展するだろう。
図3 公平性やプライバシー問題に対応しようとしているImageNetデータセット
※参考:「ImageNet:大規模なカラー写真の画像データベース:AI・機械学習のデータセット辞典 - @IT」。ImageNet公式サイトより引用。
4. MLOpsはさらに成長し、採用する企業が増えていく
昨年は「MLOpsが浸透し、企業は大きな推進力を獲得する」と書いた。これについては2020年中はまだまだ道半ばという印象を持っている。とはいえ筆者の観測範囲では、2020年中は地味にMLOpsの情報は出続けてきた。ちなみにAWSによれば、MLOps関連のサービスであるSageMaker(主にトレーニングやデプロイ作業を自動化できる)を使えば生産性が桁違いに高まり、実際に導入企業が増え続けているそうだ。
MLOpsが今後、下火になる要素はどこにも見つからない。2021年も引き続き、MLOps関連のツール/サービスなどは成長し、企業でのMLOpsの採用が増えていくことになるだろう。ちなみに@IT/Deep Insiderでは「MLOpsイベントレポート」という形で情報発信を続けていくので、ぜひその連載をウォッチして記事をMLOpsの実践にご活用いただけるとうれしい。
5. エッジAIが普及し、エッジデバイスでの機械学習関連処理が当たり前になる
Copyright© Digital Advantage Corp. All Rights Reserved.