ディープラーニングや機械学習にはGPUの利用が適している。だが高性能なGPU搭載サーバをオンプレミスで導入すると初期投資額がネックになる。パブリッククラウドのサービスは料金体系に不安が残る。どうすればよいのだろうか。
国内でGPUの存在感が際立ってきた。GPUはディープラーニング/機械学習に欠かせない技術となっており、AI(人工知能)活用にとって重要な要素の一つといえる。
製造業では、生産ラインでの部品や商品の外観検査などで、AIカメラの活用が進んでいる。製造工程を画像に記録してわずかな部品の差異から機器の故障を予測したり、ラインを流れる商品の画像から不良を検知したりする。大量の画像をディープラーニングで学習させる際にはGPUが向いている。
流通小売業では、倉庫内でのパレットの動きをAIカメラで計測してより効率的な動線を確保したり、店舗内での顧客の回遊行動をAIカメラで分析して購買やプロモーションにつなげたりしている。画像解析による商品の分類や映像解析による人流の把握などにGPUを活用できる。
自動運転車による交通情報の映像解析や、ドローンを使った社会インフラ整備のための外観検査、医療分野における画像解析に基づいた診断といった応用事例もある。画像や映像だけではなく、学術研究機関における流体解析や分子動力学などのシミュレーションにもGPUが使われている。より身近なところでは、WebサイトやSNSのテキスト分析、デジタルマーケティングにおけるデータ分析なども挙げられるだろう。
GPU活用に関する事業を展開しているハイレゾの山田岳史氏は「GPUを活用することで、演算処理にかかる膨大な時間を大幅に短縮することができます。AI開発やデータサイエンス、シミュレーションなど、普段目にしないところでもGPUの活用が進んでいます。AI・IoTが普及する社会において、企業がビジネス活動を推進していく上で、GPUは不可欠だといえます」と話す。
GPUを活用する場合、オンプレミスでGPU搭載サーバを所有するケースと、GPUの機能をクラウドサービスとして利用するケースがある。
オンプレミスで高性能なGPUサーバを所有するケースでは、高額な初期投資が大きな課題になる。研究開発用のGPUサーバを購入する場合、少なく見積もっても数百万円の予算が必要になる。予算が限られた研究開発やPoC(概念実証)において、高額なGPUサーバを所有するハードルは高い。
近年では、初期コストやリソース調達の容易さを考慮して、オンプレミスとクラウドを組み合わせたハイブリッド構成を採用するケースもある。大手パブリッククラウドベンダーは、GPUクラウドサービスを提供しており、GPUを利用しやすくなっている。だが、クラウドサービスは基本的に従量課金であり、コストが高騰するリスクがあるため、予算計画を立てづらい。AIモデル開発においては、所要時間を読みづらく、使っているうちにコストが高騰し、予算を超過することがある。
「GPUを利用するに当たり、環境構築で詰まるケースが多い」(山田氏)。例えば、GPUサーバ上でディープラーニングなどを目的として、ドライバやフレームワーク、ライブラリをインストールしたとしても、それぞれのバージョンの組み合わせや「相性」で正常に動作せず、動作検証に膨大な時間を費やすことがある。
GPU活用の課題解決に向けてハイレゾが展開しているのが「SOROBAN」だ。SOROBANは「ハイエンドGPUサーバを低価格で提供し、より多くの人に利用してもらう」ことをコンセプトにしたGPUクラウドサービスであり、特長は3つある。
1つ目は、「クラウドを活用した格安のサブスクリプションサービス」(山田氏)であることだ。オンプレミスでは初期導入コストが高くなりやすいという課題に対応した。IaaS(Infrastructure as a Service)なので、初期費用無料で利用でき、計算リソースを必要なときに必要な分だけ調達できるため、コストを最小限に抑えることができる。必要な計算リソースを必要な分だけ調達し、利用できる。さらに「他社GPUクラウドサービスに比べてランニングコストが安く、最低料金80円からのプランを用意している」(山田氏)。主にNIVIDIA A100(NVIDIA A100 Tensorコア GPU)などのハイエンドGPUサーバのプランをそろえ、他にもAMDのGPUプランを用意している。
NVIDIA A100は第3世代Tensorコアを内蔵したGPUだ。最新演算フォーマットの「Tensor float32」を利用することで、前世代の「NVIDIA V100」と比べ、最大20倍のパフォーマンスを発揮し、AI演算性能は312テラFLOPSをうたう。単一のGPUを最大7つの独立したインスタンスに分割して、複数の異なるワークロードを並列で実行可能だ。
2つ目は、月額固定料金を選択できることだ。これはクラウドの従量課金がもたらす「コストが高騰するリスク」に対応したものといえる。明瞭な料金体系で、安心して予算計画が立てられるメリットがある。契約期間内あれば、どれだけ使っても完全定額であり、予算を超過するリスクがないため、試行錯誤が必要で所要時間を読みづらいAIモデル開発には最適だ。
3つ目は、環境構築の工数を大幅に削減できることだ。すぐに活用できるように、あらかじめ必要な環境がセットアップされた状態で提供する。具体的には、NVIDIAが開発、提供しているGPU向けの汎用(はんよう)並列コンピューティングプラットフォーム「CUDA(Compute Unified Device Architecture)」や、人気のあるディープラーニング用ライブラリ「TensorFlow」「PyTorch」「Keras」の他、実行環境の「Jupyter Lab」「Anaconda」がプリインストールされている。いずれも動作検証済みのバージョンをセットアップしているため、スムーズに環境を構築できる。
「自ら利用するソフトウェアを選びたい」「よりこだわった使い方をしたい」といった場合でも、ネットワーク経由で仮想マシン(VM)インスタンスを自由にカスタマイズして利用できる。「環境設定の手間をできるだけ削減したい」というニーズに対しては、ハイレゾが環境設定を代行する無料オプション「ORDER MADE OPTIONS」も用意している。
最新機種もある。「NVIDIA A100を8基搭載したGPUスーパーコンピュータ『HGX A100』もクラウドでご利用いただけます。5ペタFLOPSのAI演算性能を備え、大規模なAI開発やシミュレーションに最適です。マルチインスタンスGPU(MIG分割)機能により、最大56のインスタンスに分割でき、AI学習や推論、分析といった複数の異なるワークロードを並列で実行できます」(山田氏)
月額固定料金や「最低料金は80円から」という低コストで提供できる理由の一つには、データセンターの電気コストを抑えていることがある。ハイレゾのデータセンターは年間を通じて冷涼な石川県志賀町に位置し、外気を最大限利用するエアフロー設計が施されている。エアコンを一切使用しないため、電力消費量(電気代)を最小限に抑えている。
また、ハイレゾがNVIDIAのパートナープログラム「Cloud Service Provider Compute 契約」をCloud/IaaS分野において「国内第1号企業」として締結したことも低コストの要因の一つだ。NVIDIAの全面協力の下、国内企業が抱える課題に対応し、ニーズに合った国産GPUクラウドサービスを開発したわけだ。
なぜ、ハイレゾがこのように国内企業に寄り添ったサービス展開に注力するのか。その理由はハイレゾの企業理念や追求しているビジョンにある。
「当社は、国内でも演算処理がIT活用のインフラの一つとされる未来を見据えて、海外ベンダーのGPUサービスではなく、国産で安定したインフラを供給し、日本のAI/ディープラーニング活用を支援することを企業理念の一つとして、2007年に設立された日本企業です。ブレストベースではAI活用のアイデアが出ていても、コスト面などからGPU活用に踏み込めない企業を手助けしたいと考えております」(ハイレゾ 取締役 小堀敦史氏)
SOROBANにおいても、海外大手パブリッククラウドベンダーにはない魅力を備え、国内企業が使いやすいサービスを提供することを目指しており、GPUのプロによる技術サポートを無料で提供している。使い方のレクチャーから環境構築の代行まで日本人のスタッフが丁寧に対応する。
「学術研究機関での研究や、AI開発のPoCにおいては、十分な予算の確保が難しいこともあります。SOROBANを活用することで、少額予算から高性能GPUサーバをご利用いただけます」と、山田氏は話す。ハイレゾの株主には、東京理科大学や北陸電力など著名な学術研究機関と企業が名を連ねる。産学連携にも積極的に取り組み、北陸先端科学技術大学院大学(JAIST)とも、WebインタフェースやWebインタフェースを通じてインスタンスを生成できるAPI、スーパーコンピュータの開発などを共同で研究している。国内企業のニーズに寄り添い、国内企業に適したサービスの開発に注力している。
「SOROBANは2021年10月現在、1カ月間無料キャンペーンを実施中です。限られた予算の中でAI活用をスモールスタートさせる絶好の機会になるはずです」(山田氏)
Copyright © ITmedia, Inc. All Rights Reserved.
提供:株式会社ハイレゾ
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2021年10月30日