Gartnerは、2027年までに生成AIソリューションの40%がマルチモーダルになり、テキスト、画像、音声、動画、数値など、複数種類のデータを一度に処理できるようになるとの見通しを明らかにした。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Gartnerは2024年9月9日(オーストラリア時間)、2027年までに生成AI(人工知能)ソリューションの40%がマルチモーダルになり、テキスト、画像、音声、動画、数値など、複数種類のデータを一度に処理できるようになるとの見通しを明らかにした。2023年には、この割合は1%にすぎなかった。
個別モデルからマルチモーダルモデルへのこの移行は、人間とAIのインタラクション(相互作用)を向上させ、生成AIを利用した製品を差別化する機会をもたらすと、Gartnerは述べている。
Gartnerのディスティングイッシュトバイスプレジデントアナリストを務めるエリック・ブレテヌー氏は、オーストラリアで同日開催されたカンファレンス「Gartner IT Symposium/Xpo」で、次のように説明した。
「生成AI市場が進化し、複数のモダリティ(データの種類)でネイティブにトレーニングされたモデルが台頭しようとしている。これらのモデルは、異なるデータストリーム間の関係を把握するのに役立つ他、あらゆるデータタイプやアプリケーションに生成AIのメリットを拡大する可能性がある。また、これらのモデルにより、AIは環境にかかわらず、人間がより多くのタスクを実行できるようサポートできる」
Copyright © ITmedia, Inc. All Rights Reserved.