Google Cloudはエッジや企業・ローカルクラウドのデータセンターで、インターネットやGoogle Cloudへの接続なしに大規模言語モデルを動かせるソリューションを発表した。情報漏えいへの懸念やデータ主権に対応できるという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Google Cloudは2024年4月9日(米国時間)、年次イベント「Google Cloud Next ‘24」で、生成AIにおけるソブリンクラウドやエッジ、マルチクラウドへの対応ソリューションを発表した。
「エッジや顧客のデータセンターなど、データが生成、利用される場所にAIを持ち込めるようにする」(バイスプレジデント兼インフラストラクチャ&ソリューションズ ゼネラルマネジャー、サチン・グプタ氏)
エッジやオンプレミスデータセンターへの対応では、以前より提供している分散マネージドインフラサービスの「Google Distributed Cloud」(以下、GDC)を活用する。ラック型とサーバ型が選べるこのサービスでは、Google Cloudによるインフラ管理の下で、AIを含むさまざまなアプリケーション/システムを任意の場所で動かせる。
今回はまず、GDCが「エアギャップ」構成(Google Cloudやインターネットに接続しない状態)でも使え、企業や公共機関が情報漏えいを恐れることなく、組織内データを活用した生成AIアプリケーションを構築・運用できると強調した。公共機関は、インフラ管理をGoogle Cloudではなくローカルパートナーに任せ、「ソブリンクラウド」に組み込めるという。
その上で、生成AIを活用するための各種新ソリューションを発表した。
第1に、NVIDIAのGPUである「NVIDIA L4」「NVIDIA H100」を組み込んだ構成を発表した。前者は小売店舗、後者は一般企業や公共分野向けに提供される。ハンバーガーチェーンのマクドナルドは、L4を組み込んだGDCを世界中の店舗に展開する予定だという。
また、コンテナサービスのGoogle Kubernetes Engine(GKE)とベクトル検索対応データベースの「AlloyDB Omni for Vector Search」をGDC上で提供する。
Copyright © ITmedia, Inc. All Rights Reserved.