2025年、「AI」はこう変わる! 注目トレンド8選:AI・機械学習の業界動向
2024年はChatGPTなどチャットAIのマルチモーダル化が進み、自律型AIエージェントも脚光を浴びました。2025年はどう進化し、社会に何をもたらすのか? 本稿では最新動向を踏まえ、8つの予測を紹介します。
2024年も@ITのDeep Insiderフォーラム【AI・データサイエンスの学びをここから】をご愛読くださった皆さま、ありがとうございました。年末年始恒例の「来年のAI動向」の予測を、今年もお届けします。
昨年は「より高性能な生成AIが続々と登場」と予測しましたが、OpenAI(ChatGPT)の推論モデル「o1」やGoogle「Gemini 2.0」など、多数の新モデルが登場して話題になりました。RAG(検索拡張生成)の普及からAIエージェントの流行までトレンドも移り変わり、「AI界隈(かいわい)は激動の1年だった」と言えますよね。
さて、2025年はどうなるのでしょうか? 今回は最新動向を踏まえて、私なりに以下の8項目を厳選してみました。技術的な進化と、その技術がもたらす社会的な変化を主に予測していきます。
- 次世代アーキテクチャの新時代へ
- AGIに向けた進化
- ドメイン特化LLMの台頭
- AIエージェントの普及
- 動画生成AIの進化
- エッジAIへの注目拡大
- Web検索の変化(Google検索の牙城は崩れるのか?)
- フェイク画像や“魔女狩り”など社会不安のまん延
1年という短いスパンだからこそ的中率も高い(はず)なので、ぜひ最後までお楽しみください!
1. 次世代アーキテクチャの新時代へ: SLMなどの流行
近年、ChatGPTやBERT(バート)などで活躍したTransformerアーキテクチャが“AIの標準”として定着しています。しかしその一方で、モデルの大規模化による費用と計算負荷の増大が深刻な課題となってきました。こうした大規模化の限界を打開しようとする取り組みが本格化したのが2024年です。
例えばMicrosoftは、2024年4月に「Phi-3」、12月に「Phi-4」という、高性能かつコスト効率の高い小規模言語モデル(SLM)をリリースしました(図1)。これらのPhiシリーズはTransformerアーキテクチャをベースとしつつ、効率化を重視した設計が特徴です。さらに同年12月には、検索エンジン「Bing」において「LLM(大規模言語モデル)とSLMを組み合わせる方式へ移行する」と発表しています。LLM単独では推論コストや速度面での課題があるため、SLMも活用することで運用効率を大幅に向上させる狙いがあるようです。
図1 Phi-4のMMLUベンチマーク: モデルサイズ(=パラメーター数)が小さくても高い性能を発揮した!
引用元:Microsoftの公式ブログ記事「Phi-4 の紹介: 複雑な推論に特化したMicrosoftの最新の小規模言語モデル」
また2024年3月には、Sakana AI(日本で創業したAIベンチャー)が「複数の小型モデルをマージ(統合)する技術」を発表し、大きな注目を集めました。従来のTransformerに基盤としない新しいアプローチが目立ち始めたことで、まさに「“次世代アーキテクチャ”の片りんが見えた年だった」と言えるでしょう。
そして2025年は、こうしたSLMやモデルマージ技術など次世代アーキテクチャが本格的に台頭してくるのではないでしょうか。AIの環境負荷を軽減すること(グリーンAI)にも関連しますが、「高性能を維持しながらモデルを小型化する」流れは、2025年のAI技術革新を象徴するテーマになりそうです。企業がSLMを実運用で取り入れ始める可能性も高く、大規模一辺倒からの大きな転換点が訪れるかもしれません。
2. AGIに向けた進化:「o3」登場など
2024年は、AGI(汎用《はんよう》人工知能)への期待が大きく高まった年でした。その一つのきっかけが、2024年9月にOpenAIが発表した推論モデルの「o1-preview」です。推論モデルとは、LLMでの回答をそのまま出力せず、回答を生成する前に問題についてより長い時間かけて“思考”(※人間のような自覚的思考ではなく、あくまでモデル内部の連続的推論)するモデルです。これにより、数学などの複雑なタスクへの性能(パフォーマンス)が高まりました。2024年12月5日には、その正式版である「o1」が発表されています。
さらに、そのo1を大幅に上回る性能を発揮する推論モデル「o3」とその軽量版「o3-mini」が12月21日にYouTubeで披露されています。このo3が、AGIに関するベンチマーク「ARC-AGI」で、OpenAIが目標としていた「人間レベルの85%」を超える87.5%というハイスコアを記録したそうです(図2)。人間と同等以上であることが一つの基準となるAGIに「また一歩近づいた」と言えるでしょう。
図2 o3のARC-AGIベンチマーク: 人間のしきい値を超えるスコアをたたき出した!(左下:o1シリーズ、右上:o3シリーズ)
引用元:OpenAIの公式YouTube動画「OpenAI o3 and o3-mini ― 12 Days of OpenAI: Day 12」
もっとも、「何をもってAGIとするか」は議論が分かれるところだと思います。私自身も、ある1つのベンチマークの成績だけで「人間と同等以上だ」と結論づけるには疑問が残ります。とはいえ、AIモデルがAGIに向けて急速に進化し続けているのは確かです。
2025年もこの動きは止まるはずもなく、「AGIのベンチマークで人間を超えた」とする発表が相次ぐと予想します。それに合わせて、そもそもの「AGIの定義」に関する議論も白熱していくのではないでしょうか。
なお、o3とo3-miniは2024年12月24日現在、安全性テストを実施しており、o3-miniのプレビュー版が2025年の1月末に、フルバージョンのo3がその少し後に一般公開される予定です。楽しみですね。
3.ドメイン特化LLMの台頭
2024年は、GoogleのチャットAI「Gemini」(2024年2月に「Bard」から改名)が、テキスト以外の画像など複数のモダリティ(=入力データ種別)に対応してマルチモーダル化を加速させるなど、AGIを目指す動きが各所で本格化した年でした。その一方で、逆に「LLM(もしくはマルチモーダルAIモデル)をドメイン(=専門領域)に特化させる」というアプローチにも注目が集まり始めた年でもありました。
例えば2024年に注目されたRAG(検索拡張生成)――いわゆる「自社情報をチャットAIに答えさせるための仕組み」――も、汎用的なAIモデルを「自社情報というドメイン(専門領域)に特化させる手法」と見ることができます。同様に、独自の情報で再学習してAIモデルを微調整するファインチューニングや、事前学習済みのLLMに追加の事前学習を行う継続事前学習といった手法も、ドメイン特化アプローチの一手段と見なせます(参考記事:Google Cloud ブログ「ドメイン特化AIアプリ: LLMを専門領域に特化するための3段階の設計パターン」、松尾研究所テックブログ「【松尾研LLM講義まとめ】ドメイン特化LLM・金融特化LLMの最新動向と活用可能性」)。
実際、Preferred Networks(PFN:プリファードネットワークス)が2024年4月に発表した継続事前学習による「金融ドメイン特化LLM」の検証事例(図3)をはじめ(他には2023年発表のブルームバーグGPTなど)、多くの企業や研究機関が“特定領域でより高性能なAI”を追求し始めています。2025年には、こうした“ドメイン特化”の考え方がいっそう広まって、一つの大きな潮流として台頭し、やがて定着していく可能性が十分にあるでしょう。
図3 汎用LLMで継続事前学習して「金融ドメイン特化LLM」を構築した結果: 性能が向上した!(表の[rinna社のnekomata-14b]よりも[Ours]の数値が高い)
引用元:PFNの公式ブログ記事「継続事前学習による金融ドメイン特化LLMの構築の検証」
また、領域固有の情報は“ドメイン特化のSLM”でカバーし、それ以外の汎用情報には“汎用のLLM”を使う――といったすみ分けも“実用的”だと考えられています。こうした組み合わせは(前述の)次世代アーキテクチャとも関連しており、2025年には「“汎用的に使えるAIモデル”と“ドメイン特化のAIモデル”をどう使い分けるか」という視点が、AI導入戦略の重要なカギとなりそうです。
4. AIエージェントの普及:“指示待ち”から“自律”へ
これまでのチャットAIは、多くの場合、人間からの質問や指示を受けて答える指示待ち型の存在でした。しかし2024年の秋以降、単にユーザーの質問に答えるだけでなく、「自分でタスクを理解し、最適な行動手順を考え、必要に応じて外部リソースを参照しつつ結果を出す」という自律的な問題解決が可能なAI、いわゆるAIエージェントが目立ってきました。
最も可能性を感じさせたのが、Anthropicが2024年10月に発表した「Computer use(コンピューターの使用)」という機能です。これは、人間と同じように、AIエージェントがマウスやキーボードでPCのGUI画面を直接操作できるようにするためのものです。これにより、APIが提供されていないアプリケーションにも対応可能となり、従来はRPA(ロボティック・プロセス・オートメーション)ツールで行っていた定型作業などの自動化も、今後はAIエージェントが代替できる未来が見えてきています。
図4 「Claude 3.5 Sonnet」モデルのComputer use機能: Webサイト上のフォームに適切な情報を自動入力している!
引用元:Anthropicの公式YouTube動画「Claude | Computer use for automating operations」
Googleも“AIエージェントが、次(2025年)の主戦場”と考えているようです。2024年12月に発表された「Gemini 2.0」の公式ブログ記事のタイトルには「エージェント時代に向けた新しいAIモデル」と表現されています。また、同じく12月に企業向けのAIエージェント「Google Agentspace」も発表されています。他にはMicrosoftもAIエージェントに力を入れてきています(参考記事:日本マイクロソフトのプレスリリース「AIエージェントで実現する業務効率化とイノベーション: 日本の最新事例」)。
AIエージェントを活用すれば、ユーザーは「○○を調査して」「資料をまとめて」「関連データを収集し分析して」といった目標を一度指示するだけで、AIが自律的にプロセスを組み立てて実行することが期待できます。ただし、現時点ではまだ実験段階であり、「AIがどこまで現実の複雑なタスクに対応できるか」は、実際の運用結果とそれに基づく改良にかかっています。また、AIエージェントの利用が広がる中で、より良い「運用ノウハウ」や実践的な知見が蓄積されていくでしょう。
2025年には、AIエージェントの導入が本格化し、ビジネスや研究の現場で急速に広がっていくと予想されます。その一方で、現在は見えていない課題や限界が顕在化する可能性もあります。しかし、“指示待ちAIから自己完結するAIへ”という進化の流れは、単なる業務効率化にとどまらず、AIが社会全体で果たす役割を再定義する可能性を秘めています。今はまだ始まりにすぎません。2025年は「AIエージェントが現実のタスクにどこまで自己完結型のソリューションを提供できるか」が問われる重要な年となるでしょう。
5. 動画生成AIの進化:「Veo2」「Sora」登場など
これまで「画像」生成AIの進化が目覚ましかった中、2024年12月に入ってから「動画」生成AIが急速な進化を遂げています。OpenAIが2024年12月に一般公開した動画生成AI「Sora」は、実写映像や本物のアニメ映像と見分けが付かないほど高精細な動画を生成できます。同時期にGoogle(Google DeepMind)が一般公開した「Veo 2」も高品質な動画を生成できます(図5)。「Veo 2」の公式ページで示されたベンチマーク「Movie Gen Bench」(指定されたプロンプトに基づきテーマや細部を忠実に反映する性能を評価する指標)の結果によると、Veo 2は「Sora Turbo」を上回る性能を示しています。
動画生成AIの性能競争はまだ始まったばかりです。2025年は、より熾烈(しれつ)な競争が繰り広げられると予想します。技術の進化が進み、エンターテインメントや教育、広告分野などさまざまなシチュエーションで動画生成AIが使われる可能性があります。2025年は、動作生成AIが躍進する年となるでしょう。
6. エッジAIへの注目拡大: 低コスト化してなお、より高性能に
エッジAIとは、ネットワークの端(エッジ)に位置するデバイス上で動作するAIを指し、Raspberry Piなどの小型コンピュータがその代表例です。2024年12月に登場したNVIDIAの小型コンピュータの最新モデル「Jetson Orin Nano Super」(図6)は、価格が従来の499ドルから249ドルに引き下げられ、推論性能は1.7倍に向上しました。この手のひらサイズのデバイスは、AI開発者やホビイストにとって手軽にエッジAIに取り組むきっかけとなるでしょう。
図6 「NVIDIA Jetson Orin Nano Super 開発者キット」が掲載されている公式ブログ記事: 手のひらサイズで推論性能は向上しつつも価格は半額に!
引用元:NVIDIA公式ブログ記事「NVIDIAが、最も手に入れやすい価格の生成AIスーパーコンピューターを発表」
この進化により、2025年はエッジAIの開発者人口が増加し、関連技術や利用事例の発表が加速すると予想されます。エッジAIは、IoTデバイスやロボット制御など、リアルタイム性が求められる現場で特に有用であり、今後も幅広い分野での活用が期待されます。2025年は、エッジAI技術がAI活用の可能性をさらに広げる年となるでしょう。
7. Web検索の変化: Google検索の牙城は崩れるのか?
長年、Google検索は情報収集の最有力ツールとして君臨してきました。しかし、検索AI「Perplexity」(2022年公開)の利用者が増え続け、2024年10月にはChatGPTにWeb検索モードが追加されるなど(図7)、検索体験が多様化しています。このような新たな選択肢の登場により、ユーザーの検索手段が広がりつつあります。
一方、Googleも2024年5月(日本では8月)に「AI Overview(AIによる概要)」機能を導入し、検索体験の向上を目指しています。ただし、一部では誤情報に関する指摘もあり、例えばTogetterの記事では、薬の用法に関する不正確な回答例が報告されました。より正確で信頼性の高い回答が今後の課題として浮上しており、Googleによる改善の取り組みに期待が寄せられます。
2025年には、AIを活用した検索体験が進化し、Google検索を補完する新たな選択肢が増えていくでしょう。日常的な情報収集では、チャットAIが重要な役割を果たす可能性があり、検索体験のさらなる進化が楽しみですね。
8. フェイク画像や“魔女狩り”など社会不安のまん延
AIによる画像生成技術が急速に進化する中、フェイク画像の問題が深刻化しています。特に学生を対象とした性的なフェイク画像が実害を伴い、日本でも社会問題となっています(参考:NHKの記事「もし性的な“フェイク画像”をAIで生成されてしまったら…【相談先も掲載】」)。
一方で、「AIによる生成ではないイラスト」が「生成AIによるものだ」とSNSで指摘される、いわば現代の“魔女狩り”問題も議論を呼んでいます。例えばプリキュアシリーズ公式アカウントによるXへのポスト(2024年3月14日)で公開されたイラストは、SNSで「生成AIによるもの」と疑われたものの、公開者が明確に否定した事例です。このような誤解を防ぐ方法として、制作過程を録画して公開する提案もありますが、手間を考えると現実的な解決策として広く採用されるのは難しいでしょう。
2025年には、フェイク画像や生成AIへの“魔女狩り”問題がさらに深刻化し、実効性のある規制や対応策の整備が求められるでしょう。国内外ではAIに関する法整備が進められており、日本新聞協会も2024年12月に「知的財産推進計画2025」の策定に向けた意見を公開し、著作権法改正の必要性を提言しています。こうした動きが加速し、AI活用とそれに付随する問題への対策でバランスを取る年となることが期待されます。
以上、2024年に起きたことを踏まえつつ、筆者の実感を基に2025年のAIに関する8つの予測をお届けしました。この他にも、地球環境に配慮して持続可能な社会を目指すグリーンAIの技術革新といったホットな話題も考えられますが、今回は長くなったので割愛し、本稿を締めくくらせていただきます。
本稿は、あくまで未来を占うような内容ですので、大きく外れる可能性もあります。その際はご容赦いただければ幸いです。2025年も引き続き、@IT/Deep Insiderをご愛読いただけますよう、お願い申し上げます。それでは、良いお年をお迎えください!
Copyright© Digital Advantage Corp. All Rights Reserved.