Google Cloud、ローカルで生成AIモデルを簡単に動かせるサービスを発表情報漏えいへの懸念やデータ主権に対応

Google Cloudはエッジや企業・ローカルクラウドのデータセンターで、インターネットやGoogle Cloudへの接続なしに大規模言語モデルを動かせるソリューションを発表した。情報漏えいへの懸念やデータ主権に対応できるという。

» 2024年04月10日 08時40分 公開
[三木泉@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Google Cloudは2024年4月9日(米国時間)、年次イベント「Google Cloud Next ‘24」で、生成AIにおけるソブリンクラウドやエッジ、マルチクラウドへの対応ソリューションを発表した。

 「エッジや顧客のデータセンターなど、データが生成、利用される場所にAIを持ち込めるようにする」(バイスプレジデント兼インフラストラクチャ&ソリューションズ ゼネラルマネジャー、サチン・グプタ氏)

 エッジやオンプレミスデータセンターへの対応では、以前より提供している分散マネージドインフラサービスの「Google Distributed Cloud」(以下、GDC)を活用する。ラック型とサーバ型が選べるこのサービスでは、Google Cloudによるインフラ管理の下で、AIを含むさまざまなアプリケーション/システムを任意の場所で動かせる。

 今回はまず、GDCが「エアギャップ」構成(Google Cloudやインターネットに接続しない状態)でも使え、企業や公共機関が情報漏えいを恐れることなく、組織内データを活用した生成AIアプリケーションを構築・運用できると強調した。公共機関は、インフラ管理をGoogle Cloudではなくローカルパートナーに任せ、「ソブリンクラウド」に組み込めるという。

 その上で、生成AIを活用するための各種新ソリューションを発表した。

 第1に、NVIDIAのGPUである「NVIDIA L4」「NVIDIA H100」を組み込んだ構成を発表した。前者は小売店舗、後者は一般企業や公共分野向けに提供される。ハンバーガーチェーンのマクドナルドは、L4を組み込んだGDCを世界中の店舗に展開する予定だという。

 また、コンテナサービスのGoogle Kubernetes Engine(GKE)とベクトル検索対応データベースの「AlloyDB Omni for Vector Search」をGDC上で提供する。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。