2021年は、Transformerを中心に技術が発展し、日本語モデルの利用環境も整ってきた。また、ローコード/ノーコードをうたうAIサービスも登場した。2022年の「AI/機械学習」界わいはどう変わっていくのか? 幾つかの情報源を参考に、8個の予測を行う。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
年末なので、2020年と2021年に続き今年も、来年2022年向けの「AI/機械学習の予測」をしてみようと思う。とはいっても、未来を予言できるほどの情報力も自信も筆者にはないので、以下のサイトからの情報源を大いに参考として、筆者なりの考えをまとめてみる。
本稿では、下記の8項目を予想した。
なお、AutoML、MLOps、TinyML(エッジデバイス上の小さな機械学習技術)、責任あるAIを支える説明可能性/解釈可能性やデータとプライバシーの規制強化などのトレンドは、数年を掛けて拡大中のため、2019年や2020年で予測した項目と重複しているが、2022年も継続するトレンドとしても分かるように、あらためて項目として書き出した。
それでは早速、1つ目から順に紹介していこう。なお、番号順は優先度/可能性順というわけではなく、単に書いた順である。
2021年の記事では「自然言語処理(NLP)に革命を起こした手法『Transformer』の利用領域がさらに拡大する」と予想した。実際に2021年中はTransformerを中心とした新技術や話題は多かったので、この予測はおおむね的中したと考えている。
2021年は日本語が使えるTransformerモデルが多数登場して、Hugging Faceから利用できるようになってきた(図1)。2021年に登場したものを少し挙げると以下のものがある。検索するとさまざまなものがヒットするので興味がある人は自分で探してみてほしい。
2022年はこういった日本語モデルを活用する事例が広く見られるだろうと予測している。
また、昨年はViT(Vision Transformer)が出てきたが、その内部メカニズムを解明しようとする研究が進んだようで、5月ごろに新たなアーキテクチャーであるMLP-Mixer(多層パーセプトロンをミックスした手法)が登場し、その後、続々と同種の手法、例えばgMLPなどが発表された。さらに2020年11月末にはMetaFormerという新たな手法も発表されている。この分野は新しいアイデアが次々と出される激戦領域となっており、2022年もその傾向は続くと予想される。
ちなみにコンピュータビジョンの研究分野では、Transformer以外には、NeRF(Neural Radiance Fields)という3次元オブジェクトを表現するニューラルネットワーク技術が熱かったようである。NeRFに関しては筆者自身が勉強不足なので詳しいことは割愛する。また、GAN(敵対的生成ネットワーク)の発展も続いており、2022年もさまざまな理論と実装が出てくると予想される。
2021年10月、GoogleのAIブログで「Pathwaysの紹介: 次世代AIアーキテクチャー」という記事が公開された(図2)。著者は有名なJeff Dean氏である。Pathwaysの内容は、現在のAIが個別のタスクに特化しすぎているので、より多くのタスクを一度に処理できるようにするAIのアーキテクチャーの実現に取り組んでいる、というものだった。完全なAGI(「汎用:はんよう」人工知能)とまではいかないと思うが、何千〜何百万のマルチタスクを実現するマルチモーダルな(=数値/画像/テキスト/音声など複数のモードを一度に処理できる)単一のAIである。
またFacebook(改めMeta) AI Researchは、2020年6月にマルチモーダルAIフレームワーク「MMF」をリリース後も現在まで開発が継続され、11月のブログ記事では「違反コンテンツをより適切に特定するための汎用化されたAIへの移行」という記事が公開されるなど、マルチモーダルAIの採用が進んできている。
このような多様なタスクに対応するマルチモーダルのAIについて、2022年はさらに多くの情報やフレームワーク、デモサービスなどが出てくる可能性があると予想している。AIの活用は、より応用的な領域にまで進もうとしている。
近年話題となっている「ローコード(Low-code)」や「ノーコード(No-code)」とは、アプリケーション開発の際にソースコードをほとんど、もしくは全く書かないことだ。この言葉が、機械学習(ML)の分野でもよく使われるようになったのが2021年である。
ローコード/ノーコードMLでは、ドラッグ&ドロップなどのビジュアル操作だけで、ほとんど/全くコードを書かずに機械学習アプリケーションを組み立てる。これにより、低コストかつ高速に機械学習が実現できる。「AIの民主化」を実現するためのキーテクノロジーだと考えられている。こういったサービスはたくさん登場していて、例えば各クラウドのAIサービスから、Microsoft LobeやTeachable Machineのようなツールやサービス、2021年12月にAWSが発表した「Amazon SageMaker Canvas」(図3)などが挙げられる。
2022年は特にビジネスユーザー/ビジネスアナリストにより広く認知され、活用するための情報や、実際の採用も増えてくるのではないかと予想される。ただし注意が必要なのは、分析されたデータを評価する上では、統計学的な知識(例えば適合率やAUCなど)が要求されることがある。こういった知識はどこかで学ぶ必要がある。例えば@IT Deep Insiderでは『用語辞典』で評価指標などを週1本ペースで少しずつ記事化しているので、活用していただけるとうれしい。
AutoMLについては、2020年「AutoMLは大躍進する」と書いたが、2021年はフレームワーク回りで注目を集めた(と筆者は感じている)。@ITでは『AutoML OSS入門』という連載が展開されており、人気を博している。特にPyCaretが人気が高かったようである。
Kaggleの2021年アンケート調査(図4)によると、KaggleでのGoogle CloudのAutoMLの利用率が2019年→2020年は2.22倍、2020年→2021年は1.67倍と着実に伸びている。同じペースで、2022年も伸びると予想できるだろう。もちろんあくまでKaggleでの話ではあるが、一般的にもAutoMLの利用は広まってきていると筆者は考えている。
なお、ビジネスユーザー向けの機械学習の自動化がノーコード/ローコードだとすれば、機械学習の実験プロセスを自動化して効率化するAutoMLは機械学習エンジニアやデータサイエンティスト向けと言えるだろう。
MLOpsについては、2020年「MLOpsが浸透し、企業は大きな推進力を獲得する」、2021年「MLOpsはさらに成長し、採用する企業が増えていく」と、毎年取り上げてきたが、2022年も継続的に広がっていくだろう。MLOpsは一過性のトレンドではなく、長い年月をかけて徐々に浸透していくものだと考えている。例えばソフトウェア開発のアジャイルやDevOpsというプラクティスは、10年以上かけて徐々に浸透してきた印象があるので、MLOpsも多くの人の日常作業になるまでにはそれなりに長い年月を要するかもしれない。
2021年のニュースとしては、5月にGoogle Cloudが、MLOpsを実現可能なVertex AIを公開した。AWSは「Amazon SageMakerがエンタープライズMLOpsプラットフォームの秀でたリーダーとして選出された」とアナウンスした。Azure Machine Learningも機械学習運用(MLOps)の情報が充実してきている。このように各クラウドプラットフォームがMLOpsに注力している状況だ。
また、MLflowやKubeflowをはじめとしてMLOps関連のツールは、さまざまな粒度/レベルで幾つもある。しかも、「どういう粒度/レベルでは、どれを使えばよいか」という知見がまだまだ確立されていないし、情報さえも少ない(と筆者は感じている)。もちろんMLOpsの構築内容は、個人レベルからエンタープライズレベルまで、しかもケース・バイ・ケースで異なるので、統一的な資料の作成は難しいだろう。一応、レベルごとの指針となりそうな「MLOps: 機械学習における継続的デリバリーと自動化のパイプライン | Google Cloud」という資料もあるが、アジャイル開発やDevOpsが実現している「日常作業」から気軽に始められる状態までには仕組みが完成されていない(と筆者は感じている)。
アジャイル開発やDevOpsでは、テスト駆動開発やリファクタリングといった日常作業のレベルで、しかもコマンド1つ、Visual StudioなどのGUIのクリック1つで作業を始められる手軽さがある。機械学習において、日常作業の中に何も気にせずにMLOpsが浸透しているかというそうはなっていない気がしている。そういった観点で、アジャイル開発やDevOpsは普通のデベロッパーに最初の一歩を採用させるプロセスが非常にうまかった。こういった小さなレベルからMLOpsに入れるようになるかが、今後のMLOpsの普及がより早く進むかの鍵になるだろう(と筆者は考えている)。
エッジデバイス向けの非常に軽量なAIモデル/TinyMLについては、2021年「エッジAIが普及し、エッジデバイスでの機械学習関連処理が当たり前になる」と書いた。筆者はあまり詳しくウオッチできていないが、前掲の参考記事によると、TinyMLの革新は続き、その活用は増えているそうで、これが2022年も続きそうである。なお、TinyML向けとして一番有名なライブラリーが「TensorFlow Lite」である。
ちなみに筆者自身は、昨年紹介したOpenCV AI Kitの小型版である「OpenCV AI Kit - Lite」が制作されたので購入した。このモジュールを、ミニぷぱ(Mini Pupper)という小型ロボット犬に取り付けることで、画像認識AIを用いたロボット犬の制御ができるようになる(図6)。このような形で筆者自身は趣味としてエッジAIやTinyMLに触れていく予定だ。TinyMLは個人が趣味で楽しめるところも魅力である。
量子コンピューティングを利用したAI(Quantum AI)もしくは量子機械学習(Quantum Machine Learning)も2022年に来る大きなトレンドとしてよく挙げられている。予測というよりも期待の方が大きいと思われるが、2021年5月にはGoogleが「Quantum AI campus」という量子AIの研究拠点(図7)を立ち上げたことがニュースとなった。関連として、前年の2020年3月に「TensorFlow Quantum」というライブラリも公開されている。このように実利用に向けて研究が進められており、2022年も実用に向けた動きがあるのではないかと予想される。
AI/機械学習の倫理や、プライバシー、公平性、透明性、解釈可能性(XAI:説明可能なAI)、アカウンタビリティーといった、人間が守るべきAIの基本原則は「責任あるAI(Responsible AI)」という言葉でまとめて語られることが増えてきている。2020年「AI/機械学習の倫理の問題は、さらに大きくなってしまう」「AI/機械学習モデルは、説明可能になっていく」、2021年「AI/機械学習の倫理問題はさらに大きくなり、データとプライバシーの規制が強化される」というトレンドを予測したが、まさにこれは当たったと言えるだろう。
まずMicrosoftは、責任あるAIを大々的にイベントなどでアピールしている(図8)。同様のアピールが、Facebook(Meta)は「Facebookの責任あるAIの5本の柱」という記事で、Googleは「Responsibilities – Google AI」というページで、アクセンチュアは「責任あるAI」というページで行われている。各企業がそれぞれ、独自の原則を打ち出すのが2021年現在のトレンドとなっている。
また、国や政府組織、国際組織でも責任あるAIのための原則が2021年は次々と規定されてきた。アメリカ国防総省では「責任あるAIガイドライン」を公開し、世界経済フォーラムは「グローバルAIアクションアライアンス」を宣言し、ユネスコ(国際連合教育科学文化機関)は「人工知能の倫理に関する勧告」を採択し、欧州委員会は「AI規制法案」を提案した。
こういった責任あるAIのための原則が各所で規定される動きは2022年も続くだろう。しかしながら、世界共通の原則制定や国際的な合意の実現はなかなか難しいと予測している。軍事でのAI利用や、AI先進国での技術発展など、自ら規制すると国益が損なわれることにもつながるので、反論意見が出やすい状況だからである。
以上、各情報源を参考にしつつ、筆者の実感を基に、8個の大予測をしてみた。この内容に賛成できる/できない、などの意見や感想もあると思うが、あくまで年末最後を記念した占い的な記事にすぎない(※ざっくりとした根拠しかない)ので、その点は差し引いて捉えていただきたい。
2021年の皆さんのご愛読に感謝したい。2022年もDeep Insiderは、機械学習エンジニアやデータサイエンティスト向けの記事を展開していく予定である。ぜひ来年も引き続きのご愛読をお願いしたい。
Copyright© Digital Advantage Corp. All Rights Reserved.