2020年は、自然言語処理(NLP)のTransformer技術に基づくBERT/GPT-3や、画像生成のディープフェイクが大注目となる一方で、倫理に関する問題がさまざまな方面でくすぶり続けた。2021年の「AI/機械学習」界わいはどう変わっていくのか? 幾つかの情報源を参考に、5個の予測を行う。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
年末なので、昨年2019年の記事(半分以上は当たっていたのではないかと思う)に続き、来年2021年向けの「AI/機械学習の予測」をしてみようと思う。とはいっても、未来を予言できるほどの情報力も自信も筆者にはないので、昨年と同じ「人のふんどしスタイル」で以下のサイトからの情報源を大いに参考として、筆者なりの考えをまとめてみる。
本稿では、下記の5項目を予想した。今年はコロナ禍のせいか情報源や情報量が少なかったので、昨年の10項目から半分に減らした。
それでは早速、1つ目から順に紹介していこう。なお、番号順は優先度/可能性順というわけではなく、単に書いた順である。
昨年2019年は「自然言語処理(NLP)がさらに躍進し、活用事例が増えていく」と予測したが、まさに2020年はNLPの年だったと誰もが実感しているのではないだろうか。その躍進の根源となる技術がTransformerである。Transformerベースである「BERT」や「GPT-3」という単語をニュースでたびたび聞いたはずだ。
TransformerはNLPにとどまらず画像認識にまで革命をもたらそうとしている(参考:「画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita」)。この動きはまだまだ始まったばかりと思われるので、2021年も続き、大きな成果が続々と得られるのではないかと筆者は予測している。
一方で、TransformerベースのNLPモデルは肥大化の一途をたどっているという問題がある。例えば2019年のGPT-2ではニューラルネットワークのパラメーター数が15億個だったのに対し、2020年のGPT-3では1750億個と急激に増加した。2021年には1兆個超えを予測する人もいるが、実際にはどうなるだろうか。既にパラメーター数が多すぎてこのレベルになると個人や小さな会社では、新規に学習することなどはかなり難しい。そのこともあり、より小さなモデルで同様の性能を実現できないかと考える研究者も増えてきているようである。そのこともあり2021年は、2020年ほどTransformer一辺倒にはならず、何かしら新しい技術が出てくるのではないかと筆者は期待している。いずれにしも、2021年もNLPは花形の分野であり続けることは間違いないだろう。
昨年2019年まではPyTorchやTensorFlowといったディープラーニングライブラリに大きな注目が集まっていた。2020年は、JAXという自動勾配(Autograd)とXLA(線形代数用コンパイラ)のライブラリが登場し、つい先日、DeepMind社内のプロジェクトでJAXの利用を拡大していることがブログで公表された。2021年は、こういったディープラーニングだけに絞らない、より汎用(はんよう)的なライブラリの活用が広がる可能性があるだろう。
また2020年は、確率的プログラミング言語(PPL)のPyroやTensorFlow Probabilityが紹介される場面が多かった(という印象が筆者にはある)。この傾向は2021年も続き、ベイズモデリングなどの情報もネットや書籍などで増えていくのではないだろうか。いずれにしても、機械学習の中でもとりわけディープラーニング一辺倒だった雰囲気はやや崩れかかっており、2021年はこれに拍車がかかると予測している。
昨年も「AI/機械学習の倫理の問題は、さらに大きくなってしまう」と書いたが、倫理的な問題はディープフェイク(=顔を変える技術)や、データセットに含まれるデータの公平性(例えば白人ばかりなど)、最近ではAI倫理研究者がグーグルに解雇された件など、さまざまな方面で常に話題になっており、昨年の予測は完全に当たったといえるだろう。AIの研究や利活用が進めば進むほど、隠れていた問題があらわになりやすいと考えられるので、2021年も2020年と同様に何らかの倫理問題のニュースが常に流れ続けるだろう。
それに伴い、データやプライバシーに対する規制を強化する動きが見られるのではないかと予想している。2021年はバイデン氏が新たな米国大統領として就任する。中国との競争でAIに関する政策は強化されるだろうが、その一方で(前任者の悪い点を徹底的に追究するためにも)人種問題などの差別を含むデータやプライバシー問題に強い規制をかける可能性があるのではないかと見ている。そうなると、日本の政府もそれに追従する可能性がある。最近では連合学習(Federated Learning)と呼ばれるプライバシーに配慮したデータ管理手法も考案されており、2021年にはそういったプライバシー関連の技術が発展するだろう。
昨年は「MLOpsが浸透し、企業は大きな推進力を獲得する」と書いた。これについては2020年中はまだまだ道半ばという印象を持っている。とはいえ筆者の観測範囲では、2020年中は地味にMLOpsの情報は出続けてきた。ちなみにAWSによれば、MLOps関連のサービスであるSageMaker(主にトレーニングやデプロイ作業を自動化できる)を使えば生産性が桁違いに高まり、実際に導入企業が増え続けているそうだ。
MLOpsが今後、下火になる要素はどこにも見つからない。2021年も引き続き、MLOps関連のツール/サービスなどは成長し、企業でのMLOpsの採用が増えていくことになるだろう。ちなみに@IT/Deep Insiderでは「MLOpsイベントレポート」という形で情報発信を続けていくので、ぜひその連載をウォッチして記事をMLOpsの実践にご活用いただけるとうれしい。
2020年はさまざまなエッジデバイス向けのAI技術が登場し活用された。例えば、2019年から既にあったエヌビディア(NVIDIA)のJetsonや、グーグルのCoralといった開発可能なデバイスから、1台2500円という格安なATOM Cam(筆者の会社では多数活用中)、非常に軽量なAIモデル/TinyML(参考:「【エッジAI】MITがまた何かすごいのを作ったようです。有名AI学会のNeurIPSで発表した内容を解説(コード・動画あり) | アイブン」)などなどである。筆者自身も、間もなく出荷される予定のエッジAIデバイス「OpenCV AI Kit」を入手予定で、個人的にエッジAI開発を楽しむ予定である。
地味な分野に思えるエッジAIだが、非常に安価なデバイスも出てきており、2021年もその進化と価格の低下は加速するだろう。そうなってくると、クラウド上で機械学習関連の処理を行うのではなく、エッジデバイス側で処理することが当たり前になっていくのではないだろうか。エッジデバイスで気軽にAI/機械学習モデルを動かせるのであれば、AI/機械学習はエンドユーザーにとってもっと身近なものとなっていくだろう。
以上、各情報源を参考にしつつ、筆者の実感を基に、5個の大予測をしてみた。この内容に賛成できる/できない、などの意見や感想もあると思うが、あくまで年末最後を記念した占い的な記事にすぎない(※ざっくりとした根拠しかない)ので、その点は差し引いて捉えていただきたい。
2020年の皆さんのご愛読に感謝したい。2021年もDeep Insiderは、機械学習エンジニア向けの記事を展開していく予定である。ぜひ来年も引き続きのご愛読をお願いしたい。
Copyright© Digital Advantage Corp. All Rights Reserved.