連載

2024年1月10日

2024年の「AI／機械学習／データ分析」はこうなる！　7大予測：AI・機械学習の業界動向

昨年2023年は、ChatGPTやGoogle BardなどのチャットAIに注目が集まり、企業やサービスに生成AIが導入されていくなど、大きな変化が一気に起こりました。今年2024年の「AI／機械学習／データ分析／データサイエンス」かいわいはどう変わっていくのか？　現状を踏まえつつ、未来を予測します。

[一色政彦，デジタルアドバンテージ] PC用表示関連情報

LINE

Hatena

連載目次

　2024年が始まりました！　今年もよろしくお願いいたします。2020年／2021年／2022年／2023年に続き、今年も2024年向けの「AI／機械学習／データ分析の予測」をしてみたいと思います。

　過去4年間、次の1年を予測してきました。100年後の予測を的中させるのは難しいかもしれませんが、現状を踏まえて1年間の動向を予測することは、それほど難しくないと感じています。昨年2023年は「一般社会で生成AIへの注目が拡大」という予測を立てましたが、まさにそうなり、その予想を超えて生成AIが世の中に浸透しました。また「最先端AIでオープンソースが流行して技術発展が加速」と予測しましたが、これも的中し、MetaによるオープンソースLLM（大規模言語モデル）の「Llama 2」（ラマ2）が登場して、これをベースとしたLLMが（例えばELYZA-japanese-Llama-2-13bなど）多数登場しました。このように2023年の予測は大半が的中したのではないかと思います。

　今年2024年については、下記の7項目を予測しました。これらも大きくは外さないはずです。

より高性能な生成AIが続々と登場
マルチモーダルAIが主戦場となる
AI活用の焦点は「自動化」から「拡張」へ
ディープフェイクの大流行と被害拡大
AIに対する法規制が強化される
新たなAI向け「オープンソース」の定義誕生
量子AI／機械学習が革命を起こす

　それでは、1つ目から順に紹介していきます。自分の持てる限りの情報力を使って、現状把握から未来予測につなげる形で丁寧に書いたつもりなので、ぜひ最後まで読んでいただけるとうれしいです。また、本稿での予測が偏り過ぎないように、できるだけ多くのサイトによる予測も参考にしました。参考資料は本稿の最後に掲載しています。

1. より高性能な生成AIが続々と登場

　筆者は毎日（営業日）、最新情報を収集しており、新しく登場したLLMなどの最新モデル（参考：図1）を毎週の編集会議で他の編集スタッフに紹介しています。2023年の1年間、特に後半は毎週、途切れることなく、新しく誕生したモデルや、バージョンアップしたモデルを紹介することになりました。それだけ大量のモデルが次々と誕生してきたわけです。「その勢いは2024年の1年間もある程度は継続する」と考えるのが自然でしょう。

図1　近年の（サイズ、つまりパラメーター数が100億以上の）大規模言語モデルのタイムライン
※論文引用: Wayne Xin Zhao, et al., 2023, A Survey of Large Language Models, arXiv:2303.18223v13 [cs.CL].（v13: 2023-11-24）をキャプチャして引用。

　最近のトレンドでは、多くの新モデルが「GPT-4を超える性能」を謳（うた）っています。私の見解では、特定の評価指標においてGPT-4を超えるモデルは存在するものの、総合的な性能ではGPT-4が依然として優れていると感じます。しかし2024年は、総合力でも本当にGPT-4を超えるモデルが登場するかもしれませんね。最有力の候補はGoogleのGemini（ジェミニ、英語の発音ではジェミナイ）でしょうか。もちろんOpenAIのGPT-4や、Anthropic（アンソロピック）のClaude 2（クロード2）、オープンソースのLlama 2などもバージョンアップして改善してくるでしょう。

　生成AIモデルの性能競争は今後も激しくなると予測されます。その恩恵として、現在のチャットAIでは完璧な返答が得られないこともありますが、1年後にはそういった問題が大幅に解消されている可能性はあると思います。

2. マルチモーダルAIが主戦場となる

　LLM（大規模言語モデル）は、テキストデータのみを受け付けて出力するAIモデルです。一方、マルチモーダルAIは、テキスト／画像／音声など複数種類のデータ（＝モダリティー）を受け付け、さらにテキスト／画像／音声などを出力する場合があるAIモデルです。2023年の後半では、例えば2023年7月13日以降でGoogle Bard（図2）が、また2023年9月25日以降でChatGPTのモデル「GPT-4V(ision)」（※2024年1月5日時点では有料のPlus版かEnterprise版のユーザーだけが利用できる）が、テキストに加えて、画像の入出力にも対応してLLMからマルチモーダル化しました。

図2　Google Bardで「猫」の画像を入出力した例

　これらのマルチモーダル化は、AIの主戦場が移行する兆候だと筆者は捉えています。2023年がLLM戦国時代なら、2024年はマルチモーダルAI戦国時代になるでしょう。また2024年には、音楽などより多様なモダリティーへの対応が進む可能性もあるかもしれません。もっと言えば、ドラえもんのような本物の「汎用（はんよう）人工知能」（AGI）に向かって躍進するのではないかと筆者は期待しています。

　とはいえ読者の皆さんも、2024年初の時点では「マルチモーダルAIの使い道や利点をイメージしづらい」と思っているかもしれません。少なくとも筆者は「どう役立つのか」のイメージを最近までつかめていませんでした。

　すぐに思い付く使い道は、画像上のテキストを読み込むOCRです。が、専門のOCRツールを使った方が性能が良いようなので、あまり適さない活用法だと思います。この他で筆者が見て「良さそう」と思ったのは、AI（機械学習）エンジニア向けになりますが、画像からファッション商品の分類タグ付けを行う活用例や、機械学習用のデータセットを作成するために画像上で境界線（セグメンテーション）により図示された物体へのラベル付け（アノテーションと呼ぶ）を行う活用例です。ちなみに筆者の場合は、ChatGPTに対して画像と一緒に「自作の図版に致命的な間違いがないか？」という質問テキストを入力したりして活用しています。

　マルチモーダルAIは登場したばかりであり、使い道のポテンシャルは未知数です。2024年は、マルチモーダルAIの進歩に伴い、新たな使い方が発明されるなど、AI活用の幅が広がっていくでしょう。

3. AI活用の焦点は「自動化」から「拡張」へ

　2023年の1年間で、生成AIは「面白そうだから試してみたい」という段階から、「仕事や私生活で実用する」という段階へとステップアップしました。Microsoft CopilotやGoogleのDuet AIなどのAIアシスタントが幅広く提供され、特に開発者の間でGitHub Copilotの利用が広がっています（利用者割合の参考資料）。また、ChatGPTなどを日常的に使用する人も増えています。

　さらに最近（2024年初頭）では、企業による独自AIアシスタントの提供が増加しています*1。例えば、ある企業ではAIアシスタント「SAISON ASSIST」や社内情報回答チャットボット「アシストくん」などを提供しています。これらの流れは、止まる理由もないので、今後さらに加速するでしょう。

*1　なお、独自AIアシスタントの構築では「RAG（Retrieval-Augmented Generation）」と呼ばれる「自社情報をチャットAIに答えさせるための仕組み」が重要です。RAGの実装については、筆者が執筆した記事で疑似体験できます。

　今の生成AIは、自動化（Automation）よりも、人間の能力を拡張（Augmentation）／アシストする方向で進化してきています。「AI」といえば、作業を完全に自動化して「人間の仕事を奪う」イメージを持たれることもありました。しかし現実的には「人間の作業をアシストする」活用方法に焦点が当たってきています。例えば、ChatGPTなどでデータ分析作業をアシストすることが可能です。

　データ分析をアシストではなく自動化するのは、難しく現実的ではありません。筆者が執筆した記事で実際にChatGPTでデータ分析してみましたが（図3）、自動実行された幾つかの作業は筆者の意図通りにならずに、結局は細かく指示して作業をやり直させる必要がありました。「人間が何をしたいか」までを超能力のようにAIに推測させるのは不可能だと思うので、未来でもAIによる仕事や私生活の完全自動化は実現できないと筆者は思います。

図3　ChatGPTでデータ分析しているところ（筆者の記事の一部をスクリーンキャプチャーして引用）

　2024年は、「拡張」のためのノウハウがより多く集まることでAI活用はさらに深化し、マーケティングや営業、製造業、医療など、さまざまな分野でAIアシスタントが活用されるでしょう。

4. ディープフェイクの大流行と被害拡大

　生成AIは、仕事や私生活を豊かにする一方で、さまざまな問題も引き起こしています。

　2023年には例えばディープフェイクポルノが問題となりました。ディープフェイクポルノとは、ポルノ動画上の女優の顔を、AIを使って、実在する他の女性の顔に置き換えるなど、AIにより「実在の人の顔」と「別人の裸の体」を合成することです。米国の高校で、男子生徒が女子生徒のヌード写真をAIで作成し、他の生徒にも共有する事件が発生しています（参考記事）。この問題の恐ろしいところは、真実ではない画像がデジタルタトゥーとしてインターネット上に残り続けることや、このようなディープフェイクポルノを取り締まる法規制が追いついていないことです。

　また、2024年1月13日に投票が行われる台湾総統選挙では、ディープフェイク、つまり「偽物の画像／動画／音声」が出回っています（参考記事）。立候補している人をおとしめて、選挙をねじ曲げようとする行為だと考えられます。ディープフェイクが手軽に作れることは、生成AIの負の側面と言えますね。

　他には、生成AIによるフェイクニュースを掲載するWebサイトが増えていたり（参考記事）、詐欺や脅迫に使われる事件が海外で発生していたりします（参考記事）。

　ディープフェイクは、それが本物かどうかを判断するのが難しいことも課題です。2023年11月にTBSの「サンデーモーニング」という番組で、本物の写真を「生成AIによるディープフェイク画像」として報道してしまったことがありました（参考記事）。画像が本物かフェイク（偽物）かを判断するのは非常に難しいです。

図4　フェイクニュースに騙されないようにファクトチェックするイメージ（いらすとやから引用）

　2024年もこの傾向は続き、ディープフェイクの問題は悪化していくでしょう。特に深刻なのが、選挙などの政治でディープフェイクが悪用されることです。1月の台湾総統選挙だけでなく、3月にロシア大統領選、11月にアメリカ大統領選挙などがあり、ここでもディープフェイクが悪用される可能性があります。日本でも選挙があれば、ディープフェイクが問題になる可能性もあるでしょう。

5. AIに対する法規制が強化される

　先ほどのディープフェイクポルノの話でも言及しましたが、急速に生成AIが発展し普及したため、その悪用を防ぐための法規制はまだ十分に整っていません。2023年中の動きとしては、例えば2023年12月20日に文化庁が「AIと著作権に関する考え方について」の素案を公開しています。またヨーロッパでは、2023年12月9日にEUの閣僚理事会と欧州議会がAI法案「EU AI Act」の暫定的な政治合意達成を発表しています（図5は欧州議会の公式発表ページ）。国連総会でも2023年12月24日に、AIにより自動攻撃するシステムへの規制を急ぐとする決議が賛成多数で採択されています。引き続き2024年も、こういったAI関連の法規制が各所で議論、策定されていくでしょう。

図5　AI法案「EU AI Act」の暫定的な政治合意達成に関する公式発表ページ（Chromeで日本語翻訳し、スクリーンキャプチャーして引用）

【コラム】効果的加速主義（e/acc）と効果的利他主義（EA）

　関連として、最近（2024年初頭）では、「まずはAIのリスクを慎重に扱うべき」と悲観的に考えるAI規制派と、「まずはAIを進歩させるべき」と楽観的に考えるAI推進派の対立が見られるようになってきました。AI規制派は効果的利他主義（EA：Effective Altruism）とも呼ばれ、AI推進派は効果的加速主義（e/acc：effective accelerationism）とも呼ばれています。例えば2023年11月17日にOpenAIのサム・アルトマン氏が理事会より共同設立者兼CEOを解任され、29日に復帰する出来事がありましたが、AI規制派（EA）の理事会と、AI推進派（e/acc）のサム・アルトマン氏との路線対立が原因という説もあります。

　e/accは、AI規制を促すEAに対抗する主義主張として位置付けられます。e/accの動きとして、インターネット黎明（れいめい）期にNetscapeというWebブラウザを開発したマーク・アンドリーセン氏が、2023年10月16日に「技術楽観主義者宣言（The Techno-Optimist Manifesto：テクノオプティミスト・マニフェスト）」という多数の人が署名したマニフェストを発表して話題になりました。この宣言では、テクノロジーを悲観視するのではなく、楽観視して進化させることが大事だと主張しています。e/accとEAの対立は、2024年もさらに激化する可能性が高いでしょう。

6. 新たなAI向け「オープンソース」の定義誕生

　一般人レベルでは「ソースコードが公開されてい（て、それを誰もが自由に使用したり、再頒布したり、その内容を自由に改変したりでき）ること」をオープンソースと呼びますが、より厳密な定義をOpen Source Initiative（OSI）という団体がしています。厳格な人は、OSIの定義に沿わないものはオープンソースとして認めないということが起きています。例えば2023年7月20日にOSIは「MetaのLLaMa 2はオープンソースではない」との声明を発表しています。LLaMa 2では、「月間アクティブユーザー数が7億人以上の場合、Metaにライセンスを申請する必要がある」とする商業条件を規定しており、誰でも自由に使用できるわけでない点が特にOSIの定義に反しているようです。

　また、筆者から見ても、LLMは秘密の部分が多いので「オープンソース」を謳っていても、確かに完全にそうとは納得できない気持ちがあります。最新の生成AIやLLM、マルチモーダルAIで実現可能な「オープンソース」と、OSIによる従来の「オープンソース」の定義には隔たりがあります。従って、できるだけ早く、新たなAI用の「オープンソース」の定義が必要だと考えています。

　OSIは既に行動を始めていて、AI／機械学習向けに「オープンソース」を定義するためのプロセスを推進しています（参考記事）。「OSI公式サイトDeep Dive：オープンソースAIの定義～明確な定義を持つ時代が来た」では、2023年6月7日に論文公募が始まり、2023年10月17日にリリース候補1の準備が開始され、2024年現在もレビューを継続中です。2024年中にも、何らかの発表がなされる可能性は高いでしょう。

図6　オープンソースAIの定義プロセスに関するOSI公式サイトDeep Dive（Chromeで日本語翻訳し、スクリーンキャプチャーして引用）

7. 量子AI／機械学習が革命を起こす

　本稿のような未来予測をする記事では「量子コンピューティング」というキーワードが近年よく挙がりますね。実際に筆者も2022年の予測記事で挙げています。これは期待を含む部分が大きいかもしれません。

　量子コンピューティングとAIが革新的に組み合わされ、複雑な計算などの問題解決が達成されると予想するケースがあります。例えば創薬で、有望な薬剤候補を見つけて作成するには何年もかかるようですが、量子AIによる革命で短期間でできるようになることなどが考えられます。

図7　量子×AIのイメージ（いらすとやから引用）

　例えば2023年12月5日にIBMが次世代量子プロセッサーを搭載したシステム「IBM Quantum System Two」を発表するなど、量子コンピューティングは発展著しい分野です。よって、筆者は何も確証や自信を持っていませんが、何が起こってもおかしくない分野だと思います。

　以上、参考資料も踏まえつつ、筆者の実感を基に7つの予測項目をピックアップして、現状把握から未来予測までをつなげる形で説明しました。

　2024年新春のあいさつとしてこの記事を執筆しましたが、あくまで占い的な記事にすぎないので、万が一、大きく外してもご容赦ください。2024年も引き続き、＠ITの「Deep Insider【AI・データサイエンスの学びをここから】」のご愛読をよろしくお願いいたします。

参考にしたサイト

「AI・機械学習の業界動向」