GoogleはGemini 1.5 Proの更新内容とGoogle AI StudioおよびGemini APIの更新内容を同社公式ブログで発表した。Gemini 1.5 Flashモデルの価格が大幅に引き下げられ、チューニング機能が全ての開発者に開放された。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Googleは2024年8月8日(米国時間、以下同)、「Gemini 1.5 Pro」更新バージョンのリリースとそれに関連する「Google AI Studio」(以下、AI Studio)およびGemini APIの更新内容を同社公式ブログで発表した。開発者やユーザーがモデルをより多く、または広範囲にテストできるように、使用制限を緩和するなどの内容が盛り込まれている。
更新内容の概要は下記の通り。
Gemini 1.5 Flashは、要約、分類、マルチモーダル理解などのユースケースを得意とするGeminiモデルだ。Googleは同年8月12日から、128Kトークン未満のプロンプトの入力価格を78%削減し100万トークン当たり0.075ドル、出力価格を71%削減して100万トークン当たり0.3ドルに引き下げた(128Kトークン以上の入力とキャッシュにも値下げが適用される)。Googleは、「これらの価格とコンテキストキャッシュのようなツールを活用することで、開発者はGemini 1.5 Flashのロングコンテキストとマルチモーダル機能を使用する際に、大幅なコスト削減を実現できる」としている。
Gemini 1.5 ProおよびFlashモデルが100以上の言語に対応するようになり、世界中の開発者が選択した言語でプロンプトを作成し、出力を受け取れるようになった。この変更により、Gemini APIを使用する際に「言語」によるモデルの終了ブロックがなくなる見込みだ。
Google Workspaceのユーザーは、追加の設定を有効にしなくても、デフォルトでAI Studioにアクセスできるようになった。アカウント管理者は、これまで通りAI Studioへのアクセスを管理できる。
Gemini 1.5 Flashのテキストチューニングが、Gemini APIおよびAI Studioを通じて全ての開発者に展開されるようになった。チューニングにより、開発者はベースモデルをカスタマイズし、モデルにデータを追加することでタスクのパフォーマンスを向上させることができる。これにより、プロンプトのコンテキストサイズが削減され、レイテンシが短縮され、場合によってはコストも削減でき、タスクの精度が向上する。
Gemini APIの開発者向けドキュメントに一連の改善内容が反映され、コンテンツ、ナビゲーション、外観、APIレファレンスが追加、更新された。
Gemini APIとAI Studioで、PDFをテキストと視覚の両方を使って解釈できるようになった。PDFにグラフや画像などのテキスト以外のビジュアルコンテンツが含まれている場合、モデルはマルチモーダル機能を使ってPDFを処理する。
AI Studioでは、キーボードショートカットの改善、画像のドラッグ&ドロップ機能の追加、読み込み時間の最大50%短縮、プロンプト提案機能の追加など、さまざまな機能が改善された。
Copyright © ITmedia, Inc. All Rights Reserved.