Gartnerが生成AIのハイプ・サイクルを発表 RAGなどが「過度な期待のピーク」に、幻滅期に入ったのは?2027年までに生成AIソリューションの40%がマルチモーダルに

Gartnerは、2027年までに生成AIソリューションの40%がマルチモーダルになり、テキスト、画像、音声、動画、数値など、複数種類のデータを一度に処理できるようになるとの見通しを明らかにした。

» 2024年09月12日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Gartnerは2024年9月9日(オーストラリア時間)、2027年までに生成AI(人工知能)ソリューションの40%がマルチモーダルになり、テキスト、画像、音声、動画、数値など、複数種類のデータを一度に処理できるようになるとの見通しを明らかにした。2023年には、この割合は1%にすぎなかった。

 個別モデルからマルチモーダルモデルへのこの移行は、人間とAIのインタラクション(相互作用)を向上させ、生成AIを利用した製品を差別化する機会をもたらすと、Gartnerは述べている。

 Gartnerのディスティングイッシュトバイスプレジデントアナリストを務めるエリック・ブレテヌー氏は、オーストラリアで同日開催されたカンファレンス「Gartner IT Symposium/Xpo」で、次のように説明した。

 「生成AI市場が進化し、複数のモダリティ(データの種類)でネイティブにトレーニングされたモデルが台頭しようとしている。これらのモデルは、異なるデータストリーム間の関係を把握するのに役立つ他、あらゆるデータタイプやアプリケーションに生成AIのメリットを拡大する可能性がある。また、これらのモデルにより、AIは環境にかかわらず、人間がより多くのタスクを実行できるようサポートできる」

2024年の生成AIハイプ・サイクルが示す動向

 Gartnerは「Hype Cycle for Generative AI, 2024」(生成AIのハイプ・サイクル:2024年)において、早期に導入することが、顕著な競争優位と市場投入期間の短縮というメリットにつながる可能性がある技術を2つ特定しており、その1つが「マルチモーダル生成AI」だ。もう1つは「オープンソースの大規模言語モデル(LLM)」で、この2つの技術は今後5年以内に、企業に大きな影響を与える可能性があるという。

 またGartnerは、10年以内に主流になると予想する生成AIイノベーションの中で、その可能性が最も高い2つの技術として、「ドメイン固有の生成AIモデル」と「自律エージェント」を挙げている。

生成AIのハイプ・サイクル:2024年(提供:Gartner〈2024年9月〉)

 Gartnerのディスティングイッシュトバイス プレジデントアナリストを務めるアルン・チャンドラセカラン氏は、生成AIのハイプサイクルについて次のような解説を加えている。

 「生成AIエコシステムは、技術やベンダーが入り乱れ、めまぐるしく変化している。そのため、このエコシステムでのかじ取りは、企業にとって極めて困難であり続けるだろう。生成AIはハイプサイクルの『幻滅期』に入っており、業界再編が始まっている。ブームが一段落すれば、今後数年間は急速なペースで機能が進歩し、さらなるメリットを得られる可能性がある」

 Gartnerは、前述した4つの生成AI技術について、次のように説明している。

マルチモーダル生成AI

 マルチモーダル生成AIは、通常では実現不可能な新しい機能を実現することで、エンタープライズアプリケーションに変革的なインパクトをもたらす。このインパクトは特定の業界やユースケースに限定されるものではなく、AIと人間の間のあらゆる接点への適用が可能だ。現在、多くのマルチモーダルモデルは2〜3つのモダリティに限定されているが、今後数年のうちに、さらに多くのモダリティが組み込まれるようになる見通しだ。

 ブレテヌー氏は次のように述べている。「現実世界では、人は音声、視覚、感覚など、さまざまなモダリティの組み合わせを通して情報に接し、理解する。マルチモーダル生成AIが重要なのは、データは通常、マルチモーダルだからだ。マルチモーダル生成AIアプリケーションをサポートするために、単一モダリティモデルを複数組み合わせると、遅延や精度の低い結果につながることが多く、結果としてエクスペリエンスの質が低下する」

オープンソースLLM

 オープンソースLLMは、商用アクセスを民主化し、開発者が特定のタスク/ユースケース向けにモデルを最適化できるようにすることで、生成AIの導入から得られる企業価値を加速させる、ディープラーニングのファウンデーション(基盤)モデルだ。さらに、企業、学術機関、その他の研究機関の開発者コミュニティー(モデルの改善と価値の向上という共通目標に取り組んでいる)へのアクセスも可能にする。

 「オープンソースLLMは、そのカスタマイズ性の高さ、プライバシーおよびセキュリティのコントロール性の高さ、モデルの透明性、共同開発を活用できる機能、ベンダーロックインを抑制する潜在力を通じて、イノベーションの可能性を高める。そして最終的に、低コストでトレーニングしやすい小規模モデルを企業にもたらし、ビジネスアプリケーションと中核的なビジネスプロセスを実現する」(チャンドラセカラン氏)

ドメイン固有の生成AIモデル

 ドメイン固有の生成AIモデルは、特定の業界、ビジネス機能、またはタスクのニーズに最適化されている。企業内でユースケースの整合性を改善すると同時に、精度、セキュリティ、プライバシーを向上させ、よりコンテキストに沿った回答を提供できるようにする。これにより、汎用(はんよう)モデルの場合ほど高度なプロンプトエンジニアリングを使用する必要がなくなり、対象を絞ったトレーニングを通じて、ハルシネーション(捏造〈ねつぞう〉された回答)のリスクを下げることができる。

 「ドメイン固有のモデルは、より高度なレベルを起点に業界固有のタスクを実現できるようにすることで、AIプロジェクトの価値実現までの時間の短縮、パフォーマンスの向上、セキュリティの強化を達成する。これにより、汎用モデルではパフォーマンスを十分に発揮できないユースケースにも生成AIを適用できるようになるため、生成AIの採用範囲が広がる」(チャンドラセカラン氏)

自律エージェント

 自律エージェントは、人間の介入なしで、定義された目標を達成する複合システムだ。さまざまなAI技術を利用して、環境におけるパターンを識別し、意思決定を行い、一連のアクションを実行し、アウトプットを生成する。環境を学習し続けることで性能が向上し、次第に、より複雑なタスクに対処できるようになる可能性がある。

 「自律エージェントは、AIの能力を大きく変化させる。その独立したオペレーションと意思決定能力は、ビジネスオペレーションを改善し、顧客体験を向上させ、新しいプロダクトやサービスを創出する。これはコストの削減や競争力の強化につながり、さらには従業員の役割の『作業者から監督者へ』の転換をもたらすだろう」(ブレテヌー氏)

 ガートナージャパンのディスティングイッシュトバイスプレジデントアナリストを務める亦賀忠明氏は、次のように述べている。「生成AIの進化は、インターネットの進化と似ており、まだ2合目だ。その進化の過程において、全般的に生成AIは『過度な期待』のピーク期の下り方向にある。そこでは『想定以上にコストがかかっている』といった幻滅的な事象も発生している。そうした注意が必要なフェーズではあるが、生成AIはこれから、ヒューマノイドやあらゆるデバイスとアプリケーションへの組み込み、汎用AI、スーパーインテリジェンスに向けた進化が想定される。企業は、産業革命、AI共生時代が到来していると捉え、リアリティーを重視しつつ、将来に向けた顧客体験、ビジネスやITの在り方、従業員とAIとの関係を含む戦略を抜本的にアップデートする必要がある」

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。