Googleは、同社の「Gemini 2.0」モデルと同じ研究および技術に基づいて構築された軽量なオープンモデルのコレクション「Gemma 3」を発表した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Googleは2025年3月12日(米国時間)、オープンなAI(人工知能)モデルファミリー「Gemma」の最新版となる「Gemma 3」を発表した。
Gemma 3は、Googleの「Gemini 2.0」モデルと同じ研究および技術に基づいて構築された、軽量で高性能なオープンモデルのコレクションだという。ノートPCからワークステーションまで、さまざまなデバイスで直接動作する。1B、4B、12B、27B(10億、40億、120億、270億)のサイズで提供され、ハードウェアとパフォーマンスのニーズに合わせて選択できる。
Gemma 3は以下の特徴を持っている。
Gemma 3は、同クラスのモデルの中でも先端レベルのパフォーマンスを実現するという。LMArenaのリーダーボードにおける人間の選好による予備的評価では「Llama3-405B」「DeepSeek-V3」「o3-mini」を上回っている。「開発者は単一のGPU(Graphics Processing Unit)またはTPU(Tensor Processing Unit)を搭載するホストで優れたユーザー体験を提供できる」と、Googleは述べている。
35以上の言語をすぐに使える状態でサポートし、140以上の言語について、サポートするようトレーニングされている。グローバルなアプリケーション開発が可能だという。
テキストおよび画像の入力とテキストの出力に対応する(1Bモデルは画像入力に対応していない)。画像、テキスト、短い動画を分析するアプリケーションを簡単に構築できる。
Gemma 3の12万8000トークンのコンテキストウィンドウにより、アプリケーションは大量の情報を処理して理解し、より高度な機能を実現できるという。
関数呼び出しと構造化出力をサポートし、タスクの自動化とエージェント体験の構築を支援する。
Gemma 3では4つのパラメーターサイズのモデルを、5つの精度レベル(32bitの完全精度から、BF16〈16bit〉、SFP8〈8bit〉、Q4_0〈4bit〉、INT4〈4bit〉まで)で使用できる。これにより、機能と処理サイクル、メモリコスト、消費電力というトレードオフを調整し、要件に合わせてパラメーターサイズと精度レベルの組み合わせを選択し、目的のパフォーマンスを効率的に実現できる。
Googleは、Gemma 3を基盤として構築した強力な画像安全性チェッカーである「ShieldGemma 2」も発表した。ShieldGemma 2は、危険なコンテンツ、性的露骨表現、暴力の3つのカテゴリーで安全ラベルを出力する。開発者は安全性ニーズやユーザーに合わせてShieldGemmaをカスタマイズできる。
Gemma 3は、既存のワークフローにシームレスに統合できる。
Copyright © ITmedia, Inc. All Rights Reserved.
Smart & Social 記事ランキング