「何でもできるクラウド」はもう万能じゃない？　ソフトバンク、日本版ネオクラウドに名乗り：国内での今後の動きにも注目

ソフトバンクは、AIデータセンター向けのソフトウェア群を搭載したクラウドサービス「AIデータセンター GPUクラウド」を2026年10月から提供する。世界的にネオクラウド市場拡大の動向が注目され始めている中での発表となった。

» 2026年06月23日 11時00分公開

[＠IT]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　AI（人工知能）需要の急増を背景に、ハイパースケーラーと呼ばれる世界的な汎用（はんよう）クラウドサービスとは一線を画した、「ネオクラウド」と位置付けられる新興勢力が世界で台頭しつつある。一部調査では、Amazon Web Services（AWS）のような主要クラウドサービスのシェアを奪いつつあるともみられている存在だ。そうした中でソフトバンクが2026年5月25日、AIワークロードに特化したクラウドサービスを2026年10月から提供すると発表。日本版ネオクラウドとも言える存在として独自のポジションを獲得できるかどうかが注目される。

世界で存在感を増すネオクラウド、日本にも波が来た？

　ネオクラウドとは主に、GPUを活用したAI処理に特化した、新興のクラウドインフラ事業者を指す。AWSやMicrosoft Azure、Google Cloudといった従来のハイパースケーラーが汎用性を重視して設計されているのに対し、ネオクラウドはLLM（大規模言語モデル）の学習・推論など計算負荷の高いAIワークロードに照準を絞り込んでいる点が特徴だ。CoreWeaveがその代表格だ。

　ソフトバンクは、ネオクラウド事業として「AIデータセンター GPUクラウド」を提供する。その提供に先立ち、同発表時点からβ版を展開し、ソフトバンクおよびグループ会社での利用を開始するとしている。

　AIデータセンター GPUクラウドは、AIデータセンター向けのソフトウエアスタック「Infrinia AI Cloud OS」と、ソフトバンクのAI計算基盤を組み合わせたクラウドサービスだ。Infrinia AI Cloud OSでは、マルチテナント環境に対応したコンテナ管理マネージドサービス「Kubernetes as a Service」（KaaS）や、LLMの推論機能をAPIとして提供する「Inference as a Service」（Inf-aaS）を利用できる。

　ソフトバンクが国内データセンターに構築した「NVIDIA GB200 NVL72」など最先端のGPUを搭載したAI計算基盤を活用し、AIモデルの学習から推論、データ処理まで幅広いワークロードに対応する。データは国内で完結して管理・運用されるため、セキュリティ面での要件が厳しい企業でも利用しやすい環境を整える。

　ソフトバンクは今後、通信基盤を生かしてAI時代の社会インフラを構築する「Telco AI Cloud構想」に基づき、AIデータセンター GPUクラウドとAI搭載通信インフラ「AI-RAN」を統合することで、学習から推論までのAIの計算処理の最適化を図る。低遅延・高信頼を実現するソブリン性を備えた分散型のAIインフラの構築を目指すとしている。

　なおネオクラウド事業者に関しては、その事業の成否をネットワークインフラが左右するという指摘も出ている。この点に関して、ソフトバンクの場合には通信インフラを持つ国内通信事業者としての強みが生きてくる可能性がある。

「AIデータセンター GPUクラウド」の3つの特徴

　ソフトバンクは「AIデータセンター GPUクラウド」の特徴として、3つを挙げている。

学習から推論まで幅広いワークロードに対応

　LLM開発など大量の計算資源を必要とするAIの「学習」から、迅速なレスポンスが求められる「推論」まで、幅広いワークロードに対応したGPU環境を提供する。NVIDIA GB200 NVL72をはじめとするGPUアクセラレーターや、GPU間接続技術「NVIDIA NVLink」などを使ったインフラを提供する。

KaaSによる柔軟な運用

　コンテナオーケストレーターであるKubernetesを活用し、多数のコンテナを一元的かつ自動的に管理。コンテナ技術により、アプリケーションのデプロイやスケーリングを効率化し、AIモデルの開発から実装、運用までの一連のプロセスの迅速化を支援する。

Inf-aaSによるモデル推論環境の提供

　Kubernetes上でのモデル推論基盤の構築・運用を自動化することで、推論APIの構築を支援する。インフラ管理にかかる負荷を軽減して、独自開発のAIモデルや任意のAIモデルを利用した推論環境を迅速に利用できるようにする。

　世界的にAI処理用のGPUへのニーズが高まる中では、ネオクラウドとして独自のインフラの強みをどう差別化して提供できるか、また通信インフラなどの強みを生かしながら独自のポジションを打ち出せるかが問われる。今後同様の動きが国内の事業者の間で広がってくるのかどうかも注目される。

ネオクラウドはなぜ「AWS、Azureとは別物」なのか？　クラウド利用の常識は静かに変わりつつある
調査会社Synergy Research Groupは、ネオクラウド市場が2031年までに約4000億ドル（約62兆円）規模に達するとの予測を発表した。AIインフラ需要の急増が成長をけん引する。
MicrosoftとGoogleだけじゃない、AWSのシェアを奪う「ネオクラウド」の正体
Synergy Researchはクラウドインフラサービス市場の第3四半期の最新データを公開。ビッグ3の市場シェア推移や、その他に台頭してきたクラウドベンダーの動向などを示した。
ネオクラウドは「AI活用のインフラ」として使えるか？　GPU性能だけでは測れない“50社の実力”
AI需要が高まる中で台頭するネオクラウド。Omdiaは企業がクラウドを選ぶ際、インフラの計算能力だけでは判断し切れない要素も加味する必要があると指摘する。
生成AI×自動運転で注目のTesla・Waymo・NVIDIA　各社が目指す「フィジカルAI」は何が違うのか
日本政府が戦略的強化分野に掲げる「フィジカルAI」――その社会実装の最前線の一つが自動運転システムだ。熾烈な開発競争が繰り広げられている中、生成AIの進化は各社の競争にどのような変化をもたらしているのか。Tesla、Waymo、NVIDIAの最新動向を整理する。
クラウドを使わず「生成AIを行政に」――宮崎県、ローカルLLM×RAGをどう実現？
宮崎県はオンプレミス型の生成AI基盤を導入し、通常業務にローカルLLMを活用する取り組みを進めている。同県は、生成AI活用を進める上での障壁となる機密データの流出リスクにどう向き合っているのか。