GPUサーバの検討を重ね、たどり着いた結論とは? 東京大学発ベンチャー社長に聞く研究開発におけるGPUサーバの高額なコストと運用面での課題

高性能GPUサーバによる計算が必要だが、オンプレは高額な導入コストや運用面で不安がある。一方、GPUクラウドサービスはランニングコストが高く、料金体系が複雑でコストが予測しにくい。どうすればよいのか――。中小企業におけるGPUサーバ活用の悩みを解消し、ビジネス拡大を後押しするGPUクラウドサービスとはどのようなものか。

» 2022年03月01日 10時00分 公開
[PR/@IT]
PR

GPUサーバの自社運用は多大なコストと手間がかかる

 リアルタイムでの画像処理などに利用される「GPU」(Graphics Processing Unit)は、膨大な演算処理を得意とするプロセッサだ。高解像度画像のレンダリングや自動運転のシミュレーション、流体解析の演算のほか、最近はAI(人工知能)やディープラーニングで求められる演算処理でも利用され、GPU搭載の演算処理に特化したサーバやPCが多くのベンダーから提供されている。

ALT メカノトランスフォーマ
代表取締役社長
徐 世傑氏

 メカノトランスフォーマは、東京大学発のベンチャー企業として2002年に創業した。同社は圧電アクチュエータの設計開発から製造、量産まで行っている。

 「創業前からこの分野の研究を続けており、すでに20年以上の研究経験があります。海外を含め特許も100件以上取得しています」と話すのは、メカノトランスフォーマ代表を務める徐 世傑(チー ジィー キィアット)氏だ。

 同社の圧電アクチュエータは、これまでにない高速かつ高精度の動作を実現し、米の異物選別機や半導体製造装置などの技術革新に寄与している。同社のアクチュエータの設計・製造には構造計算の最適化が欠かせないのだが、同社ではコンピュータ上で試作機をつくりシミュレーションすることで、実機を作る前に性能や効果を検証している。実機製造前にシミュレーションし、アクチュエータの用途開発を迅速に行うノウハウがあることが、メカノトランスフォーマの強みだ。

 シミュレーションには、膨大な計算処理をするGPUサーバが必要になる。メカノトランスフォーマでは20年にわたり圧電アクチュエータの事業を続けており、徐々に拡大してきた。近年では案件も増え、構造計算の需要も増大している。

 「案件が重なれば計算の需要も一気に増え、GPUサーバをさらに増やす必要があります。計算業務がスムーズにできないと、ビジネスのボトルネックになりかねません。それをどうやって解決するかが課題でした」(徐氏)

 同社では、シミュレーションに必要な演算処理のために、従来はGPUを搭載したPCを複数台用意して対応してきた。だが、案件の増加に合わせて今後もPCを増やし続けるのは現実的ではない。

 また従来のGPUを搭載したPCでは、計算に時間がかかることも問題だった。そのために、演算性能の高いGPUサーバの導入を検討したという。しかしながら、高性能なGPUサーバは導入コストが高い。さらにサーバを本格的に運用するには、それを安定稼働するための設備を用意し、セキュリティを保証しながら運用する必要がある。

 「われわれにはサーバ運用のノウハウがなく、これにはかなりの手間がかかることが予想されました」(徐氏)

クラウドならGPUサーバの運用をプロに任せ、本業に集中できる

 サーバの運用は、メカノトランスフォーマにとって本業ではない。中小規模の企業である同社には、専任のサーバ運用管理者を雇う余裕はなかった。またアルバイトを雇い教育することで、なんとか運用できないかと模索した。しかし、その体制での安定運用には、かなりの負担が発生する。特に大手企業と取引する上でも欠かせないセキュリティの保証は容易ではない。

 また、オンプレミスでサーバを運用する場合、コロナ禍でのテレワークに対応しにくいことも問題だった。さらに、災害発生時などの事業継続を考えた場合、自社で非常時を考慮したサーバの継続運用は簡単ではない。そのため「貴重な情報はなるべく社外に置くべきとの結論に至りました」と徐氏は振り返る。

 「オンプレミスでのサーバ自社運用は難しい」と判断し、クラウドの利用を検討。「自分たちで専門家を雇えないなら、クラウドでプロに任せて運用してもらう方が、心理的な負担も大きく削減できると考えました」と徐氏。クラウドなら需要に応じて柔軟にサーバリソースを増やすことも容易で、コストも最適化できる。契約するだけですぐに利用を開始することができ、サーバの設置場所や電源確保などの心配もない。その上、インフラに関するセキュリティについても考えなくてよい。

 「クラウドならGPUサーバの運用に関する心配がなくなり、本業に専念できると考えました」(徐氏)

最新GPU NVIDIA A100を低コストかつ明確な料金体系で使えるGPUSOROBANを採用

 GPUサーバのクラウドサービスにも、現状はさまざまなものがある。数あるサービスからメカノトランスフォーマが選んだのは、ハイレゾが提供するGPUクラウドサービス「GPUSOROBAN」だった。

ALT 「GPUSOROBAN」はNVIDIA A100搭載のハイエンドGPUサーバを業界最安値で使えるクラウドサービス(提供:ハイレゾ)《クリックで拡大》

 もちろん、メガクラウドベンダーもGPUクラウドサービスを提供している。しかしながら「いずれもランニングコストが高額で、料金体系が複雑で事前にコストを把握しにくいものでした」と徐氏。メガクラウドベンダーのサービスでは、GPUインスタンスの利用料金が従量制で、さらにネットワークやストレージの費用も別途発生するため、事前にどれだけの費用になるか予測しにくいところがあるのだ。

 また、当時のメカノトランスフォーマは、最新GPU「NVIDIA A100」の利用を望んでいた。NVIDIA A100 TensorコアGPUは、データセンター用GPUのハイエンドモデルで、最新アーキテクチャ「NVIDIA Ampere」を採用し、前世代の「NVIDIA V100」と比べて最大20倍のパフォーマンスのAI演算性能、312テラFLOPSを発揮する。この高い計算能力が、同社の計算業務には必須と考えていたのだ。しかし、当時、日本国内でNVIDIA A100のGPUサーバを利用できるクラウドサービスは少なく、海外サービスを利用する場合には情報を国外に持ち出すリスクと、距離が離れることによるレイテンシが懸念された。

 こうしたメガクラウドのサービスへの懸念や課題に対し、「GPUSOROBANは安価で、料金体系が明確。月額や年額が固定になっています」と徐氏。メガクラウドではサービスを自分たちで理解し、組み合わせるといくらになるか手間をかけて計算する必要があるが、GPUSOROBANなら必要なものが全てそろった状態で、月額費用がシンプルに決まる。その上、GPUSOROBANは日本国内のデータセンターでNVIDIA A100を利用できるのが魅力だった。

 GPUSOROBANが安価なのは、ハイレゾが日本最大級のGPU専用データセンターを運用しており、エアコンを使用しない外気を取り入れたエアフロー設計などで消費電力を抑える工夫をしていることが理由だ。さらに、NVIDIAのクラウドパートナーとしてクラウドソリューションプロバイダー契約を国内で初めて契約し、NVIDIA A100の大量導入などによって、サービスコストを抑えている。

 「メガクラウドの料金体系は複雑過ぎます。GPUSOROBANのように分かりやすく安価な仕組みが、われわれには最適でした」(徐氏)

すぐに見えたGPUSOROBANの導入効果、業務効率が向上し受注拡大

 メカノトランスフォーマは、2021年4月からGPUSOROBANの利用を開始した。オンプレミスとクラウドでの試行錯誤を繰り返し、検討に1年ほどかかっている。その間、クラウド利用における情報漏えいのリスクなどについて、十分に議論できたという。結果的には、セキュリティの保証などはプロに任せるべきだとの判断に至っている。

 GPUSOROBANへの計算環境の移行については、コロナ禍でリモートでの作業となったが、大きな苦労はなかった。ハイレゾのサポートを受けながら、テストを含めて移行作業を迅速に進めることができたのだ。また、移行後の利用手順についても、ハイレゾから十分なサポートと情報提供があり、こちらもスムーズに進んでいる。

 現在、メカノトランスフォーマでは国内9人、海外1人の従業員がGPUSOROBANのGPUサーバを利用してアクチュエータ設計の計算をしている。GPUサーバを柔軟に増やせるため、従業員がリソースを気にせずに同時進行で利用できる。GPUSOROBANに移行したことで、従業員が計算したシミュレーション結果を、徐氏がリモートからクラウドにアクセスしてチェックすることも可能になった。

 GPUSOROBANへの計算環境の移行後、受注を調整・制限することがなくなり、機会損失は減っているという。「小規模の会社では、少人数で事業をまわしているからこそ、従業員の業務効率を上げることが特に重要です。GPUSOROBANの活用で無駄な時間がなくなり、年度末の案件が重なるような繁忙期にも従業員が効率的に働けるようになったことは大きなメリットです。計算リソースが足りないために受注を制限する必要もなくなり、前年比で売り上げ・利益とも確実に増えています」(徐氏)。また、GPUSOROBANで計算効率も上がったことで、顧客への返答時間も短縮しており、それが受注率の向上にもつながっている。

 「GPUSOROBANを利用し始めてまだ1年未満ですが、確実に導入効果が見えてきています」(徐氏)

 徐氏は、設計の人員を今後さらに増やしたいと考えている。そのための人材は世界中から採用する予定だ。

 「GPUSOROBANはクラウドサービスなので、世界中のどこにいても同じように利用できます。インドやマレーシアなどには計算に長(た)けている人材が多くいます。GPUSOROBANの計算環境を活用することで海外人員を補強して、ビジネスをさらに拡大していきたいですね」(徐氏)

Copyright © ITmedia, Inc. All Rights Reserved.


提供:株式会社ハイレゾ
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2022年3月20日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。