ソフトバンクは、AIデータセンター向けのソフトウェア群を搭載したクラウドサービス「AIデータセンター GPUクラウド」を2026年10月から提供する。世界的にネオクラウド市場拡大の動向が注目され始めている中での発表となった。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
AI(人工知能)需要の急増を背景に、ハイパースケーラーと呼ばれる世界的な汎用(はんよう)クラウドサービスとは一線を画した、「ネオクラウド」と位置付けられる新興勢力が世界で台頭しつつある。一部調査では、Amazon Web Services(AWS)のような主要クラウドサービスのシェアを奪いつつあるともみられている存在だ。そうした中でソフトバンクが2026年5月25日、AIワークロードに特化したクラウドサービスを2026年10月から提供すると発表。日本版ネオクラウドとも言える存在として独自のポジションを獲得できるかどうかが注目される。
ネオクラウドとは主に、GPUを活用したAI処理に特化した、新興のクラウドインフラ事業者を指す。AWSやMicrosoft Azure、Google Cloudといった従来のハイパースケーラーが汎用性を重視して設計されているのに対し、ネオクラウドはLLM(大規模言語モデル)の学習・推論など計算負荷の高いAIワークロードに照準を絞り込んでいる点が特徴だ。CoreWeaveがその代表格だ。
ソフトバンクは、ネオクラウド事業として「AIデータセンター GPUクラウド」を提供する。その提供に先立ち、同発表時点からβ版を展開し、ソフトバンクおよびグループ会社での利用を開始するとしている。
AIデータセンター GPUクラウドは、AIデータセンター向けのソフトウエアスタック「Infrinia AI Cloud OS」と、ソフトバンクのAI計算基盤を組み合わせたクラウドサービスだ。Infrinia AI Cloud OSでは、マルチテナント環境に対応したコンテナ管理マネージドサービス「Kubernetes as a Service」(KaaS)や、LLMの推論機能をAPIとして提供する「Inference as a Service」(Inf-aaS)を利用できる。
ソフトバンクが国内データセンターに構築した「NVIDIA GB200 NVL72」など最先端のGPUを搭載したAI計算基盤を活用し、AIモデルの学習から推論、データ処理まで幅広いワークロードに対応する。データは国内で完結して管理・運用されるため、セキュリティ面での要件が厳しい企業でも利用しやすい環境を整える。
ソフトバンクは今後、通信基盤を生かしてAI時代の社会インフラを構築する「Telco AI Cloud構想」に基づき、AIデータセンター GPUクラウドとAI搭載通信インフラ「AI-RAN」を統合することで、学習から推論までのAIの計算処理の最適化を図る。低遅延・高信頼を実現するソブリン性を備えた分散型のAIインフラの構築を目指すとしている。
なおネオクラウド事業者に関しては、その事業の成否をネットワークインフラが左右するという指摘も出ている。この点に関して、ソフトバンクの場合には通信インフラを持つ国内通信事業者としての強みが生きてくる可能性がある。
ソフトバンクは「AIデータセンター GPUクラウド」の特徴として、3つを挙げている。
LLM開発など大量の計算資源を必要とするAIの「学習」から、迅速なレスポンスが求められる「推論」まで、幅広いワークロードに対応したGPU環境を提供する。NVIDIA GB200 NVL72をはじめとするGPUアクセラレーターや、GPU間接続技術「NVIDIA NVLink」などを使ったインフラを提供する。
コンテナオーケストレーターであるKubernetesを活用し、多数のコンテナを一元的かつ自動的に管理。コンテナ技術により、アプリケーションのデプロイやスケーリングを効率化し、AIモデルの開発から実装、運用までの一連のプロセスの迅速化を支援する。
Kubernetes上でのモデル推論基盤の構築・運用を自動化することで、推論APIの構築を支援する。インフラ管理にかかる負荷を軽減して、独自開発のAIモデルや任意のAIモデルを利用した推論環境を迅速に利用できるようにする。
世界的にAI処理用のGPUへのニーズが高まる中では、ネオクラウドとして独自のインフラの強みをどう差別化して提供できるか、また通信インフラなどの強みを生かしながら独自のポジションを打ち出せるかが問われる。今後同様の動きが国内の事業者の間で広がってくるのかどうかも注目される。
ネオクラウドはなぜ「AWS、Azureとは別物」なのか? クラウド利用の常識は静かに変わりつつある
MicrosoftとGoogleだけじゃない、AWSのシェアを奪う「ネオクラウド」の正体
ネオクラウドは「AI活用のインフラ」として使えるか? GPU性能だけでは測れない“50社の実力”
生成AI×自動運転で注目のTesla・Waymo・NVIDIA 各社が目指す「フィジカルAI」は何が違うのか
クラウドを使わず「生成AIを行政に」――宮崎県、ローカルLLM×RAGをどう実現?Copyright © ITmedia, Inc. All Rights Reserved.