TechTargetは「Google Gemini AI アップデート」に関する記事を公開した。LLMの性能競争が激しくなる中、生成AIアプリの開発者や利用者にとって本当に必要な性能や機能とは何か? 「Google I/O 2024」の基調講演を通じて探る。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
TechTargetは2024年5月14日(米国時間)、「Google Gemini AI アップデート」に関する記事を公開した。Googleは2024年6月に、大規模言語モデル(LLM)の「Gemini」アップデートと、「Google AI Studio」「Vertex AI」の新しい機能をリリースする。このアップデートと新機能の目的は、既存のバージョンよりも効率を高めて高度なアプリケーションワークフローをサポートすることだ。
2024年6月に一般提供開始予定のGoogle Gemini 1.5 Pro(以下、Gemini 1.5 Pro)は、全世界200カ国でGoogleのさまざまなコンシューマーサービスやデベロッパーサービスでのプレビュー公開が予定されている。2024年5月上旬に開催されたGoogleのデベロッパー向けイベントGoogle I/O 2024の基調講演で同社関係者が明らかにしたところによると、Gemini 1.5 Proは一般提供開始時点で最大100万トークンのコンテキストウィンドウをサポートするという。なお、2024年2月の発表では、Gemini 1.5 Proがサポートするのは12万8000トークンで、100万トークンのサポートは実験段階だった。
コンテキストウィンドウとは、LLMが一度に処理できるテキスト、音声、動画のデータ量を示す。トークン数100万は、ビデオなら約1時間、オーディオなら11時間、コードなら30万行、単語なら75万語に相当する。
Googleはさらに、最大200万トークンのサポートを計画しており、2024年後半にプレビュー版を提供開始する予定だ。GoogleのデベロッパーツールであるGoogle AI StudioやVertex AIのユーザーは、このプレビュー版の待機リストへの登録ができる。
さまざまなプロジェクトでVertex AIを利用している、Pantheonのデビッド・ストラウス氏(Pantheon共同設立者 最高技術責任者<CTO>)は次のように語る。
「コンテキストウィンドウは、AI(人工知能)の作業用メモリのようなものだ。コンテキストウィンドウを大きくすることで、コンテキストに依存する高度なタスクにどの程度役立つかはまだ不明だが、コンテキストウィンドウの拡大によって、完全なトレーニングやファインチューニングをすることなしでAIで処理できるタスクが増えるだろう」
Copyright © ITmedia, Inc. All Rights Reserved.