いずれはベクトル型アーキテクチャを代替
「ベクトル型スパコンは高すぎる」、GPU利用のHPCが本格化
2008/02/21
「GPUは、CPUに比べると、ちょっと知能は落ちる。しかし、いったん走り出せばイノシシのように50倍ぐらいの速さで走る」。並列処理コンピューティングの第1人者として知られる中村維男教授はGPU(グラフィックス・プロセッシング・ユニット)の特性をそう説明する。GPUは条件分岐が入る処理などは苦手だが、単純な計算処理の並列化では大きな力を発揮する。
こうしたGPUの特性から、これまでベクトル型の並列コンピュータやCPUのクラスタ構成で実現してきたHPC(ハイパフォーマンスコンピュータ)、いわゆるスパコンで、GPU(グラフィックス・プロセッシング・ユニット)を使う流れが加速しそうだ。
ゲームという一大市場を背景に、コンシューマ向け製品で技術革新を続けてきたGPUは、CPUと異なる進化を遂げた。画像処理専用のロジックを進化させる一方、きわめて高い並列処理能力を獲得。CPUがようやく4コア、8コアという現在、GPUはすでに128の計算処理ユニットを持つにいたっている。純粋な計算処理能力を理論値で比較すると、AMDの2.8GHz駆動のクアッドコアOpteronを2基搭載するPCで10GFlops超であるのに対して、NVIDIAが2007年5月にリリースしたGPUコンピューティング向け製品「Telsa」シリーズでは、1GPUで500GFlopsを超える計算能力を持つ。
また、GPUを搭載するグラフィックカードには、すでにビットマップテクスチャを扱うための大容量メモリが搭載されており、PCI Expressによるバス幅の広帯域化が進むなど、GPUのHPC分野への適用の条件はそろいつつある。
圧倒的なコストメリットでいずれベクトル型を凌駕
GPUをCPUと組み合わせてHPC分野で利用する“GPUコンピューティング”の強みはコストメリットだ。
「ベクトル型コンピュータはとにかく高い。同じ計算結果を得るのに必要なコストをベクトル型コンピュータとGPUで比較すると、その価格には3.5桁の開きがある」(中村教授)。500GFlopsを超える処理能力を持つTelsaの実勢価格は20〜160万円程度。Telsaは1GPUを搭載するボード型、2GPUを搭載する外付け型、4GPUを搭載するラックマント型の3製品がありスケーラビリティも高い。ベクトル型コンピュータとGPUの価格差は、開発研究から回路設計、実装にいたるまで、すべて自社でまかない、一部のユーザー企業や組織にだけ提供する専用スパコンのビジネスモデルと、秋葉原でも買えるコモディティと化したグラフィックボードのビジネスモデルの違いから来るものだ。
圧倒的なコストメリットがあることから、中村教授は「いずれGPUがベクトル型を食う」と見る。「CPUとGPUを、アプリケーションによって最適な比率で自由に組み合わせて使う時代になる」。中村教授によれば、理想的な計算環境とは単一のOS、単一のシェアードメモリを中心に、FPGA、スカラー計算モジュール、ベクトル計算モジュール、GPUが接続されたものだが、ベクトル計算が行ってきた計算処理を徐々にGPUが取っていくことになると予想する。
2月21日にNVIDIAのTelsaを採用したHPC製品「Asterism」(アステリズム)の新モデルを発表した日本SGIの橋本昌嗣氏(高度ビジュアル・メディア開発本部 本部長)は、同社の過去の歴史になぞらえて、現在のGPUコンピューティング立ち上がりの構図と同社の狙いを、こう説明する。「SGIはグラフィックワークステーションでCPUにMIPSを採用していたが、その後、インテルやAMDといったメーカーのコモディティ化され、安定供給されるようになったCPUに勝てなくなった。同様に、NVIDIAやATIによってGPUのコモディティ化は進んだ。今後も顧客に製品を安定供給するという観点からも、コモディティ化したGPUを使い、日本市場にもGPUコンピューティングを根付かせたい」。同社は、すでに内製アプリケーションを持つ企業などから、PCクラスタからGPUコンピューティングへの移行をにらんだ引き合いがあるとしている。
Telsaは単体で購入してPCで利用することもできるが、日本SGIはワンストップでビジュアライゼーション関連の技術やコンサルティングまで含めて提供することで差別化を図る。
開発環境とノウハウ蓄積が課題
GPUコンピューティングの課題はソフトウェアだ。適用分野は学術研究、科学技術、医療、金融などを想定しているが、まだノウハウの蓄積が乏しい。適応領域ごとの向き不向きの検証なども今後の研究課題だ。
Telsaでは、NVIDIAが無償提供する開発環境「CUDA」(クーダ)の利用が前提だ。CUDAでは線形代数や高速フーリエ変換など利用頻度の高いライブラリも用意する。
日本SGIによれば、CUDAはC言語に似た構文に専用APIが含まれる程度と学習コストが低いという。また、すでに並列処理向けに書かれたアプリケーションであれば移植は容易。ただ、並列コンピュータの世界ではFortanを使うユーザーが多く、そうしたユーザーに、どう移行を促すかという課題もある。
こうしたことから、日本SGIは、同社が主催するHPC Open Forumの分科会の1つとして新たに「GPU Computing分科会」を設立。日本SGI、NVIDIAジャパン、エルザ ジャパン、プロメテック・ソフトウェアなどGPUコンピューティングに関わる主要な企業メンバを幹事としつつ、ユーザー間の情報交換、ノウハウ蓄積の場を提供する。分科会長に就任した中村教授は「現在の日本はコンピュータサイエンスの分野では弱い。GPUコンピューティングのような新しいチャレンジをして、日本から情報を発信していく」と話している。
関連リンク
関連記事
情報をお寄せください:
- Intelと互換プロセッサとの戦いの歴史を振り返る (2017/6/28)
Intelのx86が誕生して約40年たつという。x86プロセッサは、互換プロセッサとの戦いでもあった。その歴史を簡単に振り返ってみよう - 第204回 人工知能がFPGAに恋する理由 (2017/5/25)
最近、人工知能(AI)のアクセラレータとしてFPGAを活用する動きがある。なぜCPUやGPUに加えて、FPGAが人工知能に活用されるのだろうか。その理由は? - IoT実用化への号砲は鳴った (2017/4/27)
スタートの号砲が鳴ったようだ。多くのベンダーからIoTを使った実証実験の発表が相次いでいる。あと半年もすれば、実用化へのゴールも見えてくるのだろうか? - スパコンの新しい潮流は人工知能にあり? (2017/3/29)
スパコン関連の発表が続いている。多くが「人工知能」をターゲットにしているようだ。人工知能向けのスパコンとはどのようなものなのか、最近の発表から見ていこう