NVIDIAがこの新興ネットワーク企業に投資したのはなぜか:AIネットワーキングの意味が変わる?
NVIDIAは2024年7月、ネットワーク分野の新興企業に出資した。既にネットワーク技術は持っているのに、なぜ新たな投資をする必要があったのか。投資先企業のCEOに聞いた。
NVIDIAは2024年7月、ネットワークのスタートアップ企業に出資した。データセンターにおける生成AI利用のための通信最適化は、「AIネットワーキング」として話題に上るようになっているが、今回の投資の目的は、それを超えたところにあるようだ.。
生成AI需要でGPUビジネスを急成長させているNVIDIAは、過去数年間、ネットワークにも力を入れてきた。HPCや機械学習/AIではサーバ/GPU利用が大規模化し、高速かつ安定した相互通信が必須要件になったからだ。
同社は2019年にMellanox Technologiesを買収し、その技術を発展させた「BlueField」(ネットワークアダプタ/DPU<Data Processing Unit>)や「Quantum」(InfiniBandスイッチ)「Spectrum」(Ethernetスイッチ)シリーズを展開する。また、独自のチップ間通信技術NVLinkを使ったラックシステムを展開している。
加えて、Cisco SystemsやJuniper Networks、HPE Aruba Networkingといった主要ネットワークベンダーとの提携も発表している。
では、なぜネットワークのスタートアップ企業に投資する必要があったのだろうか。投資先企業のCEO(最高経営責任者)に聞いた。
いわゆる「ネットワーク機器ベンダー」ではない
NVIDIAが出資したのはArrcusという企業だ。Arrcusは2024年7月の資金調達ラウンドで3000万ドルを獲得したが、その半分に当たる1500万ドルをNVIDIAが出資した。Arrcusがこれまで合計で1億5700万ドルの資金を調達していることを考えると、NVIDIAの出資比率は10%という計算になる。
NVIDIAによる投資の理由をArrcus CEO(最高経営責任者)のシェイカー・アイヤー氏に聞くと、「生成AIがラックを超える存在になってきたからだ」と答えた。
Arrcusは、スイッチやルータといったネットワーク機器のベンダーではなく「ネットワークOSベンダー」だ。スイッチやルータといったネットワークハードウェアは、高速な転送を実行するチップを搭載しているが、通信制御を行うソフトウェアが必要だ。これが「ネットワークOS」と呼ばれる。例としてはOpen Compute ProjectにMicrosoftが寄贈したSONiCがある。
ArrcusのネットワークOS「ArcOS」は、BroadcomのTomahawkをはじめとしたチップを搭載するホワイトボックススイッチで動かすことにより、CiscoやJuniper、Arista Networksなどのデータセンタースイッチに対抗できる。
もちろん、標準に準拠しており、他社のネットワーク製品とも接続できる。
ただし、スイッチ/ルータのハードウェアだけでなく、例えばコンテナとして動かすこともできる。このため、LAN、WAN、オンプレミス、クラウド、エッジを問わず基本的にはどこでも相互接続でき、その通信制御機能を活用できる。そしてこれらの相互通信をプログラムし、包括的なポリシーとして適用できる。
NVIDIAのネットワーク製品に関していえば、既にBlueField DPU上で動作するようになっており、販売を開始しているという。NVIDIAを通じた入手も可能になっている。今後はSpectrum Switchなどのサポートも予定している。
例えばBlueField DPUでは、まずDPUの機能としてIPsecを含む通信処理をCPUからオフロードした上で、ArcOSによってトラフィックの優先制御やバイパスなどが行える。この目的で、ArcOSを搭載したスイッチを組み合わせることができる。なお、ネットワークポリシーは管理コンソールによって集中管理できる。
「(インテリジェントな通信制御によって)重要なタスクには高価なコンピュートリソースを与える一方、重要でないタスクに対してはGPUの利用を制限するなど安価なリソースを割り当てることができる。これにより、CPUとGPUの利用効率を高め、経費と投資の双方を最適化できる」(アイヤー氏)
さらに、AIの学習と推論のどちらも単一のデータセンター内では収まらないケースが増えてくることを、アイヤー氏は強調する。
「複数のデータセンターでそれぞれ学習を行い、結果を統合するような手法が広がってくる」(アイヤー氏)
これについては、データの秘匿性を保ちながら、より正確なモデルを作ることのできる「連合学習」という手法が知られるようになっている。NVIDIAも「NVIDIA FLARE」というソフトウェア開発キットを公開している。
こうしたWANをまたがるユースケースで、どこにでも導入できてネットワークポリシーをエンド・ツー・エンドで集中管理できるArrcusの価値がさらに発揮できるという。
「Arrcusは、分散AIアーキテクチャを支えることができる」(アイヤー氏)
NVIDIAの名前は目を引くが、Arrcusは同社に買収されたわけではない。以前から、ソフトバンクや日立ベンチャーなどが出資しており、Arrcusの独立性に変化はないとアイヤー氏は強調する。特にソフトバンクに関しては、同社の5Gビジネスに大きな役割を果たせるとしている。
Arrcusはソフトバンクなどと共同で、SRv6を使った5Gのネットワークスライシングの実証実験を進めている。高速で低遅延な5Gに、IPベースのため低コストのネットワークスライシングを柔軟に適用できるようにすることで、ネットワークサービスの価値を高められるとしている。
例えばエッジとソフトバンクのMEC(Multi-access Edge Computing)データセンターをつなぎ、ネットワークスライシングを適用することで、多様な顧客や用途に対して差別化したサービスが提供できる。
これまでのネットワーク関連企業との関係も変わらない。Arrcusは上述の通り、NVIDIAとは競合するともいえるBroadcomチップへの対応を進めてきたが、この協業関係に変化はない。Ciscoなどとの相互接続検証も、引き続き行っていくという。
Copyright © ITmedia, Inc. All Rights Reserved.