Google、LLM「Gemini 1.5 Pro」の改良と「Gemini 1.5 Flash」「Gemma」の新モデルを発表ネイティブマルチモーダルモデルと軽量オープンモデルの両ファミリーを拡充

Googleは、大規模言語モデル「Gemini 1.5 Pro」のアップデート、新しい軽量モデル「Gemini 1.5 Flash」、Gemini APIの新機能、軽量オープンモデルファミリー「Gemma」の新モデルを発表した。

» 2024年05月20日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Googleは2024年5月15日(米国時間、以下同)、大規模言語モデル(LLM)「Gemini 1.5 Pro」のアップデート(200万トークンのコンテキストウィンドウなど)、Geminiファミリーの新しい軽量モデル「Gemini 1.5 Flash」、Gemini APIの新しい開発者向け機能、次世代オープンモデル「Gemma 2」、Google初のビジョン言語モデル「PaliGemma」を発表した。

Gemini 1.5 Proの改良と新しい1.5 Flashモデル

 2023年12月に公開されたGemini 1.0は、Google初のネイティブマルチモーダルモデルだった。パフォーマンスが強化され、100万トークンの長いコンテキストウィンドウを備えた1.5 Proが2024年2月に公開された。Googleは2023年12月から、企業が「Google AI Studio」とGoogle Cloudの「Vertex AI」でGemini APIを利用できるようにしている。

Gemini 1.5 Proの改良

 Gemini 1.5 Proは今回、翻訳、コード生成、論理的推論とプランニング、マルチターン会話、音声と画像の理解など、主要なユースケースにわたって品質が改善された。

Gemini 1.5 Flash

 この小型Geminiモデルは、モデルの応答速度が最も重要な、より狭い範囲のタスクや高頻度のタスクに最適化されている。要約、チャット、画像や動画のキャプション、長い文書や表からのデータ抽出などに優れている。

提供時期

 両モデルとも、2024年5月15日から200以上の国、地域でプレビュー版が入手可能になった。6月に一般提供が開始される。

ネイティブマルチモーダルと長いコンテキストウィンドウ

 Gemini 1.5 ProとGemini 1.5 Flashは100万トークンのコンテキストウィンドウを備えており、テキスト、画像、音声、動画の入力をインターリーブすることができる。1.5 Proはコンテキストウィンドウが200万トークンに拡張される。この機能にアクセスするには、Google AI Studio用かVertex AI用の待機リストに登録する必要がある。

Gemini APIの新しい開発者向け機能と料金オプション

新しい開発者向け機能

 2つのAPI機能(ビデオフレーム抽出と、一度に複数の関数呼び出しを返せる並列関数呼び出し)が導入される。2024年6月には、Gemini 1.5 Proにコンテキストキャッシュ機能が追加され、プロンプトの一部(大きなファイルを含む)をモデルに一度送信すれば済むようになる。

料金

 特定の地域でGoogle AI StudioからGemini APIに無料でアクセスできるようになる。また、新しい従量課金サービスでサポートされる使用量制限の引き上げも可能になる。

Gemmaファミリーの新モデル

 Gemmaは、Geminiモデルの開発に利用された研究と技術によって構築された軽量オープンモデルファミリーだ。

Gemma 2

 次世代オープンモデルであるGemma 2は、2024年6月に提供が開始される。Googleは、開発者にとって最も有用なサイズで業界をリードするパフォーマンスを実現するとしている。新しいGemma 27B(270億パラメーター)モデルは、2倍以上のサイズを持つ一部モデルを上回るパフォーマンスを発揮し、Vertex AIでGPU(Graphics Processing Unit)や単一のTPU(Tensor Processing Unit)ホスト上で効率的に動作する。

PaliGemma

 Google初のビジョン言語オープンモデル。2024年5月15日に提供が開始された。画像キャプション、ビジュアルQ&A、その他の画像ラベリングタスクに最適化されている。既存の「CodeGemma」「RecurrentGemma」と同様に、事前にトレーニングされている。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。