Googleが「Gemini 3 Pro」を公開し、AIモデル競争はさらにヒートアップ。高度な思考、画面理解、複雑タスクの自動実行、コード生成など、多方面での性能向上が確認されている。記事後半では、今回の発表をどう読むべきか、筆者の視点からも解説する。

» 2025年11月21日 05時00分 公開
　Google DeepMindは2025年11月18日（米国時間）、同社にとって「最もインテリジェント（知性的）なモデル」と位置付ける最新AIモデル「Gemini 3 Pro」を公開した。

　思考力（リーズニング）、マルチモーダル理解力、エージェント実行能力、コーディング性能といった多方面で、従来モデルを大きく上回るとGoogle自身は説明しており、さらに、ランキングサイトであるLMArena（言語モデルを対象とした人間投票ベースの評価）では、執筆時点（2025年11月19日時点）においてText（文章）、WebDev（Web開発）、Vision（画像）の3部門で1位を獲得している。

LMArenaのランキング画面をキャプチャしたもの（2025年11月19日時点） LMArenaのランキング画面をキャプチャしたもの（2025年11月19日時点）
左上がText（文章）、右上がWebDev（Web開発）、左下がVision（画像）の各部門のリーダーボードで、Gemini 3 Proは1位となっている。表内のScoreは、モデル同士が同じ課題で対戦し、その勝敗に基づいて決まるEloレーティング（回答の“強さ”を数値で表した指標）であり、値が高いほど多くの対戦で他のモデルより良い回答を出したことを意味する。

　ちなみに、Gemini 3 Proの公開前日にはxAIが「Grok 4.1」をリリースしており、一時はText部門で1位だったが、その翌日にはGemini 3 Proに追い抜かれた格好である（言語モデル界も世知辛いですね……）。

――ここからは『Deep Insider Brief』恒例の“ひと言コメント”として、今回の発表から技術の“今”を少し深く見ていく。


一色政彦

　Deep Insider編集長の一色です。

　言語モデルを提供する企業、特にGoogle、OpenAI、Anthropic、xAI、そして中国勢の間で、性能競争はますます熾烈（しれつ）になってきましたね。どの企業も短いスパンで次々と新モデルを投入し、ベンチマークの順位が日単位で入れ替わるほどで、まさに“AIモデル戦国時代”といった様相です。

　その中でGoogleは「AIに全てを賭ける」という強い姿勢を明確にしており、今回のGemini 3の発表も、内容・情報量ともに“Googleの本気”がはっきりと伝わるものでした。

　実際、Gemini 3は一般向けサービスだけでなく、Google検索のAIモードを含め、既に複数の領域で提供が始まっています。AIコーディング用途でも利用可能で、私が日常的に使っている「GitHub Copilot」でも「Gemini 3 Pro（公開プレビュー）」モデルが選択できるようになっています。

　この他、CursorなどのAI開発ツールも次々に対応を発表しています。ある程度まで無料で試せるGoogle AI StudioのPlaygroundでも、「Gemini 3 Pro（公開プレビュー）」モデルを選択できるようになっており、開発者がすぐに実践活用しやすい状況です。

　SNSの反応を見る限り、現時点では好意的な声が多い印象があります。Gemini 3 Proは（マルチモーダル）理解力が高いため、特にフロントエンド分野での“バイブコーディング”（厳密な仕様ではなく、イメージを伝えてコードを生成してもらうスタイル）との相性が良いようです。こうした開発が多い方は、メインモデルとしてしばらく使ってみる価値がありそうです。

　また、Gemini 3 Proと同時に、Googleは新しいAIコードエディタ「Google Antigravity」（アンチグラビティ：反重力）も発表しました。今回はGemini 3 Pro以外にも多数の発表が重なっており、「情報量が多過ぎて追い切れない」と感じる方もいるかもしれません。まずは本稿で紹介した内容を押さえたら、次はGoogle Antigravityを試してみるのはどうでしょうか。


　今回のGemini 3 Proの発表には、ここまで紹介した内容以外にも多くの情報が含まれていた。長くなるため、主要な項目だけを以下に箇条書きでまとめておく。なお、ここではGemini 3 Proに関する内容のみに絞っているため、それ以外の発表については割愛する。

Gemini 3 Pro： その他の開発者向け特徴

  • 最高レベルの思考（リーズニング）能力： 複雑な問題に対して筋道を立てて回答を導く能力を持つ。数学・科学・コーディングなどの分野でSOTA（最高水準）の性能を示し、数学のベンチマーク「AIME 2025」ではツールなしで95.0％、コード実行ありで100％を記録。
  • 卓越したエージェント性能： function calling（関数呼び出し）／検索／コード実行といったツール利用や、多段階タスクの計画と実行能力が大幅に向上。ソフトウェア修正のベンチマーク「SWE-bench Verified」では76.2％を達成し、実運用レベルのエンジニアリングタスクにも強い。
  • マルチモーダル理解の進化： テキスト、画像、音声、動画に加え、PDFやコードベース全体も理解可能。UIスクリーンショットからコード生成するようなワークフローにも対応。
  • 100万トークンの長文コンテキスト： コンテキストウィンドウ（＝AIが一度に読み込んで覚えておける入力範囲）は1M（＝100万）トークンに対応。大規模なリポジトリや長文PDF、多数のファイルをまとめて解析できる。

Gemini 3 Proの主な利用環境

  • GitHub Copilot（有償プランのPro／Pro+／Business／Enterpriseなど）
  • Cursor
  • Google AI StudioおよびGemini API
  • Google CloudやVertex AI
  • Google Antigravity

Gemini 3 Pro（公開プレビュー） APIの価格表

  • 100万トークン当たり：
    • 入力トークン（20万以下）： 2.00ドル
    • 入力トークン（20万超）： 4.00ドル
    • 出力トークン（20万以下）： 12.00ドル
    • 出力トークン（20万超）： 18.00ドル
  • コンテキストキャッシュ利用時（100万トークン当たり）：
    • 読み出し（20万以下）： 0.20ドル
    • 読み出し（20万超）： 0.40ドル
    • 保存：4.50ドル（100万トークンまでを1時間保存した場合の料金）
    • コンテキストキャッシュとは、一度処理した入力内容（コンテキスト）を保存し、再利用するための仕組み。キャッシュからの読み出し時は再計算が不要になるため、低コストで利用できる。

　価格は今後変更される可能性もあるので、厳密にはGoogle公式ドキュメント「Gemini Developer API pricing」を参照してほしい。

