検索
ニュース

激化するAIエージェント基盤争い Googleは推論用TPUや新たな「Google Enterprise」で攻めるGoogle Cloud Next ‘26

Google CloudがGoogle Cloud Next ’26で、AIエージェント基盤の進化をアピールした。推論特化TPUからデータ管理、アプリ構築・運用基盤に至るまで、企業におけるAIエージェント活用の高度化・大規模化を支えられるとしている。

Share
Tweet
LINE
Hatena

 「AI(人工知能)エージェントプラットフォーム」「AIエージェントOS」は市場の新たな焦点になった。AIモデルベンダー、ハイパースケールクラウド、スタートアップなど、誰もがAIエージェント基盤の王者になろうとしている。

 Google Cloudが2026年4月22日(米国時間)に開幕の「Google Cloud Next ‘26」で発表した王者獲得のための新しい取り組みとは。

推論に最適化した新TPU「TPU 8i」を発表

 まず、Google CloudはTPUの第8世代「TPU 8」を発表した。TPU 8には2つの種類がある。学習に最適化した「TPU-8t」と推論用の「TPU-8i」だ。

 推論用のTPUを発表した理由について、Google Cloudは次のように説明している。

 多くのユーザーにとっての今後のテーマは推論の高度化と大規模化。学習ではスループットとバッチ処理のスケーリングが求められるが、推論では異なる。低遅延が必須であるとともに、ロングコンテキスト用に大量のメモリが求められる。こうした特性の違いのため、学習用とは別個のアーキテクチャで推論用のTPUを設計した。


学習用のTPU 8t(左)と推論用のTPU 8i(右)

 実際に、TPU 8iは前世代と比較して1.8倍のSRAMを搭載し、大量のKVキャッシュを提供できるという。

 推論の高度化、大規模化は直接的なコストの上昇にもつながる。複数のAIエージェントをオーケストレーションするような使い方が広がると、効率性が大きな課題となる。Google Cloudは、新TPUの電力効率の高さも強調する。

 「推論は継続的に実行されるものだ。運用コストを抑制するためには、推論に最適化された電力効率の高いハードウェアが必要だ」(Google Cloudのトーマス・クリアンCEO)

 TPUでは、従来世代から電力効率を大きなテーマとしてきた。新たな推論TPUでも、こうしたフォーカスは変わらないという。電力効率は直接的にはクラウドベンダー側の課題だが、ユーザーにとってもコストパフォーマンスとして跳ね返ってくる。

「Google Enterprise」は万人のためのAIエージェントインタフェースに発展

 今回の面白い発表の一つに、Google Cloudサービスの包括的なMCP(Model Context Protocol)対応がある。「GKE(Google Kubernetes Engine)」「Google Cloud Spanner」「Google BigQuery」など全てのプラットフォームサービスや、Google WorkplaceサービスにMCP経由でアクセスできるという。

 これを含め、Google CloudはエージェンティックAI時代の新たな基盤を構築したとアピールする。以前から進めてきた仕組みに拡張や新機能を加えたり、組み換えたりして、新時代のプラットフォームを作り上げたとする。

 データに関しては、従来の業務システムやアプリケーションの垣根を超えた統合的なコンテキストを提供する。

 このために、他のクラウドサービスやSaaS、データベースなどに分散するデータを共通のApache Iceberg形式で管理し、移動や複製をせずに同時に読み込めるようにする。

 そしてこれらのデータを統合的なセマンティックグラフで管理し、AIのエージェンティックな処理において的確なデータを利用できるようにするとしている。

 Google Cloudは今回、あらゆるユーザーがAIエージェントを構築し、利用し、デプロイし、管理するための基盤として「Gemini Enterprise」を位置付けた。


Google Enterpriseのアーキテクチャ

 Gemini Enterpriseといえば、「Google Agentspace」の発展形だ。2025年10月に名称変更が行われ、プラットフォーム的な機能を指向したものになっていた

 Gemini Enterpriseでは、フローチャートを描くようなノーコードツールあるいはCLI(コマンドラインインタフェース)でAIエージェントを構築できる。複数エージェントを組み合わせた複雑なシステムも作れる。今回、長期メモリやエージェントの長期継続稼働もサポートすることをGoogle Cloudは発表した。また、「プロジェクト」では複数ユーザーが協力してエージェントアプリを構築できる。

 作成したAIエージェントは、社内の他のユーザーと共有できる。また、このインタフェースからGoogle CloudやサードパーティーのAIエージェントアプリを利用することも可能。マーケットプレイスではAtlassian、Box、Lovable、Oracle、ServiceNow、WorkdayをはじめとしたAiエージェントアプリを提供していく。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る