検索
Special

早稲田大学 笠原研究室がIBM POWERに注目した理由低電力消費とハイパフォーマンスコンピューティングの両立に向けて

低消費電力かつハイパフォーマンスコンピューティング環境を――いま、早稲田大学笠原研究室が取り組む技術に産業界の注目が集まっている。この取り組みの中で笠原研究室は、IBM Power Systemsに搭載されているプロセッサーである「POWER」に注目し、POWERを用いたオープンな開発コミュニティ「OpenPOWER Foundation」に加入したという。編集部では、笠原氏の研究の狙いと、コンピューティング環境の将来像について直接取材する機会を得た。

PC用表示
Share
Tweet
LINE
Hatena
PR

せっかくのHPCも運用停止!? 看過できない消費電力問題

 2015年2月22日、ある報道が話題を集めた。日本の科学技術計算の中核を担うスーパーコンピューター「京」が、電力コストの問題から涙ぐましいコスト削減を強いられているというのだ(関連記事)。

 京がフル稼働した際に、消費する電力量は12.65989MW(TOP500ベンチマーク実施時)。これは一般家庭約3万世帯分もの電力になり、関連記事によると年間20億円を超える金額だという。関連記事によれば、計算機能力をフル稼働させるベンチマーク実施時でなくとも2万5千世帯分の電力消費となっているという。電力コストの変動が、運用コストに与える影響はすさまじいものになることが容易に想像できる。

 京が、電力問題で稼働を危ぶまれているという事実は、ビッグデータ時代を迎え、システムが大容量データ処理を求められている今、決してハイパフォーマンスコンピューティング(HPC)の領域だけにとどまる問題ではなく、今後のコンピューティング環境を考える上で看過できない大きな課題を示したといえる。多くのコンピューティング環境において、消費電力量の抑制は共通の課題なのである。

電力消費量の低減を競うコンピューティング環境

 多くの一般読者は「京ほどの巨大スーパーコンピューターでなければ消費電力は大きな問題ではない」と考えるかもしれない。多少負荷が高まる時間帯に電力を使ってしまうのは致し方がない、と。しかし、ご自身が利用しているコンピューターや、データセンターでは、その構築に際して必ず電力やファシリティのコストが考慮されていること、そして使用料に反映されていることを忘れてはならない。

 さらに、システムが処理しなければならないワークロードが増え、サーバー台数も増加し続ける中、それらのサーバーを集約すれば、稼働時に熱を発するプロセッサーが過密に配置されることになる上、冷気との接触面積も減ることから、発する熱を排出するためには工夫が必要になる。データセンター用のサーバーであれば、空気の流れを計算したり、外気との温度差を利用したりといった廃熱の工夫を施したり、電力で空調設備や廃熱ファンを駆動する必要がある。これらのコストは利用者に結果的に転嫁される仕組みになっているだろう。電力消費問題は人ごとではないのである。この課題を解決し、かつ高いパフォーマンス性能を両立する方法があるというのだ。

低消費電力とハイパフォーマンスコンピューティングは両立可能

 「そもそも、効率の良いプロセッサーを効率よく動かし、電力消費量を少なくすれば、発熱量も低減し、こうした問題の発生を抑えられる」――。直近のHPCやデータセンターが抱える問題に対して、こう指摘するのは、早稲田大学教授で、同大学「アドバンスト・マルチコア・プロセッサ(AMP)研究所」所長 笠原博徳氏だ。


笠原博徳氏

 AMP研究所は、早稲田大学「グリーン・コンピューティング・システム研究開発センター」(以下、GCS)の一角にある。

 GCSは、経済産業省の全面的なバックアップを受け、日本における「グリーン・コンピューティング・テクノロジー」の開発拠点として2014年5月に開設された。そのGCSにあって、AMP研究所が担っているのは、「グリーン・マルチコア・コンピューティング」技術の研究開発と、産学連携による開発技術の実用化だ。

 「最終的には、巨大なスーパーコンピューターも、太陽電池で動かそうと考えているのです」と笠原氏は語る。

産業界の注目を集めるOSCAR

 笠原氏が研究を進める「OSCAR」は、マルチコアプロセッサーの電力制御をソフトウエア的に可能にするコンパイラであり、協調動作するハードウエアアーキテクチャと一体で開発されてきた。

 マルチコアプロセッシング(プロセッサーの並列処理)では、プログラムを動作させている全てのコアが常時働いているわけではなく、処理待ちの状態に置かれるコアもある。通常は、こうした「待ち」状態のコアも相応の電力を消費する。これに対してOSCARでは、処理待ちのコアに対し、ナノ秒単位で動作周波数を落としたり、動作を止めたりといった制御をかけられる。これにより、プログラム稼働時のマルチコアプロセッサーの電力消費量を大きく減らすことができるわけだ。

 「このような機能を備えたコンパイラは、世界を見渡してもOSCAR以外にありません」と、笠原氏は胸を張る。


取材では笠原研究室の学生による消費電力量低減のデモを見学させていただいた。中央モニターの右側、青で表示されているのがOSCARコンパイラを使った電力制御を行った場合の消費電力を示している

 OSCARは適用環境が多い点も魅力的だ。

 「電力制御の機構が実装されていれば基本的にあらゆるプロセッサーに対応可能」(笠原氏)だという。

 いまや自動車だけでなく、あらゆる機器にプロセッサーが搭載されている中、製品開発の場面では、日々成長する複雑なシステム/ソフトウエア機能や、それらのライフサイクルへの対応を逐一実行する必要があり、膨らむ開発コストを抑え、いち早く製品を市場投入するために、日夜「乾いた雑巾を絞る」ように効率化を進めている現状がある。そんな製品開発の現場でOSCARのテクノロジを応用することで、開発効率の向上など大きな成果も実現できるという。

 「例えば、2コア対応のプログラムを4コア対応に切り替えるケースを考えた場合、手作業によるチューニングでは数カ月単位の時間が必要です。OSCARを使えば、コンパイルし直すだけでコア数に応じたプログラムの並列化・最適化が完了します。その効率の良さは、あらゆる場面で、大きな経済効果につながるはずです」

 OSCARを活用することで、プロセッサーとそれを制御するソフトウエアの開発リードタイムが短縮でき、さらに、消費電力量も削減できる。加えて、後述するように並列処理最適化で処理そのものも高速になるというのだから、OSCARに日本の産業界をリードする企業が注目するのもうなずける。

低消費電力・高性能プロセッサー研究のリファレンスプロセッサー POWER

 「OSもプロセッサーの電力制御機能を持っていますが、OSの制御は、複数の異なるアプリケーションを並行稼働させる際に、アプリケーションごとのプロセッサー使用状況を見ながら、電力制御をかけていくタイプのものです。かたや、OSCARは、一つのアプリケーション内で、マルチコアの電力消費を最適化します。ですから、OSCARとOSの電力制御機能との『かけ算』で、大きな省電力効果が期待できるのです」と、笠原氏は説明する。

 そんな笠原氏の研究を長年にわたり支えてきたのが、「IBM POWER」だ。POWERはIBM Power Systemsに搭載されているプロセッサーである。

 笠原氏は、「POWER4」の時代から、最新の「POWER8」に至る全世代のPOWERプロセッサーを用い、コンパイラの研究開発に活用してきた。同氏によれば、「POWERがなければ、OSCARが現在のように成長し、実用化されることはなかった」と言えるほど、POWERを使い込んできたという。

POWERの広帯域かつ低レイテンシの特性は並列化に有利

 笠原氏がそれほどまでにPOWERを高く評価する理由は、POWERに特有のアーキテクチャが優秀であるからだという。

 笠原氏は、POWERアーキテクチャを次のように評価する。

 「POWERが優れているポイントの一つは、コアとメモリを結ぶネットワークの通信帯域が広く、かつ、レイテンシ(遅延)が非常に小さいこと。この特性のために、POWERではプログラムの並列化によって実に素直に性能が上がっていきます。これは、並列コンパイラの研究開発プラットフォームとして極めて有用な特性です」(笠原氏)

 直近で発表された「POWER8」でもこの特性は強化されており、前世代の「POWER7+」と比較して、メモリ通信帯域、ソケット当たりのスレッド数、キャッシュサイズそれぞれを大幅に拡大している。

 この性能向上は、POWER同士の比較では分かりにくいかもしれない。2015年5月に発表されたインテルのハイエンド向けx86アーキテクチャプロセッサー第3世代「Xeon E7製品ファミリー」(開発コード名「Haswell」)と比較すると分かりやすいだろう。

 例えば、並列処理の要となるソケット当たりのスレッド数では、Xeon E7-8890 v3の場合、最大18コア/36スレッドであるのに対し、POWER8は、最大12コア/96スレッドと、約3倍になっていることが分かる。

 また、最大メモリ通信帯域で見ると、第3世代Xeon E7製品ファミリーでは102GB/秒であるのに対し、POWER8では230GB/秒と2倍以上だ。

 「メモリ通信帯域の広さや低レイテンシという特性は、大量データを扱うような一般のサーバーシステムに適用しても優れた特性だといえるでしょう。POWERと他のハイエンドプロセッサーを用いたサーバー上で、それぞれコア数を増加させて性能検証を実施したところ、POWERは他のサーバーと比較してよりリニアにスケールすることが確認できました」(笠原氏)

 POWER8では、こうしたプロセッサーそのものの性能に加えて、CAPI(Coherent Accelerator Processor Interface)を利用したハードウエアアクセラレーションも実現していることから、大規模並列処理やビッグデータを活用したアプリケーションに非常に適したアーキテクチャになっているといえる。

 OSCARの開発では、まずはPOWERで並列性能の検証を行ってから、他のプロセッサーでの動作検証を行っているという。POWERでうまくいったものを他のプロセッサーに展開することで、プロセッサー特性の差分も分かりやすくなるそうだ。

 POWERプロセッサーとOSCARの組み合わせは既に多様な領域で実用化が進んでいる。適用領域とその恩恵を知ると、この技術とPOWERのポテンシャルをより明確に感じられることだろう。

既に実社会にもたらされているPOWER+OSCARの低消費電力・高性能並列処理の恩恵

 OSCARと組み合わせた際のPOWERの「リニアな性能向上」については、既にに多くの実証結果がある。

 一つは、大手電気メーカーと共同研究を進める「重粒子線ガン治療」システムのケースだ。このケースでは、POWER7(64コア)とOSCARとの組み合わせにより、システムの処理スピードを従来製品の「55倍」に向上させた。他のプロセッサーではこのようにスケールすることは非常に難しいという。

 「この治療機器では患者の体に合わせて照射計画の調整が必要なため、患者に横たわってもらってから調整を行う必要があります。従来はこの再計算に非常に時間がかかっていました」(笠原氏)

 重粒子線ガン治療にかかる時間は20分から22秒へと55倍速になり、1日当たりの処置可能人数も増えた。この成果は結果的に「治療の価格を引き下げることにつながり、健康保険適用の可能性も広げています」と、笠原氏は付け加える。


重粒子線がん治療システムにおけるPOWER+OSCARの適用(クリックで拡大)

 また、防災科学研究所の「地震動シミュレーション」システムのケースでは、POWER7(128コア)とOSCARとの併用で、約200Gバイトのデータ処理を(1コア処理時の)110倍強にまで向上できるとの結果が出ている。

 笠原氏によると、こういったPOWERの性能向上は、大規模並列計算だけでなく、マルチメディア処理など、基本的にどんなアプリケーションでも簡単に実現できるというので、幅広い応用が期待できるだろう。

ビッグデータ処理にも高い適性を持つPOWER上へのOSCARの実装が拡げる可能性

 笠原氏は次なる研究において「最新の『POWER8』に搭載されている電力制御機能を用いて電力削減を実現したい」と述べ、これを機にOSCARによるPOWER8の電力制御に取り組む計画だ。

 「POWERは、科学技術計算のみならず、トランザクション処理やビッグデータ処理、画像処理など、広範な用途への応用が利くマルチコアプロセッサーです。このプロセッサーと我々の技術との融合を一層推し進め、大容量の高速データ処理が求められるシステムにおけるさらなる可能性を模索してきたいと考えています」と、笠原氏は言う。

OpenPOWER Foundationに加入。その狙いとは

 早稲田大学 笠原研究室は、POWERテクノロジを用いた更なる研究の促進と、開発技術の適用領域拡大に向け、「OpenPOWER Foundation」に加入した。Foundationに加入することで、POWERの技術情報を入手できるだけでなく、参加メンバーとの技術協力、コラボレーションにより、開発技術の適用領域がこれまで以上に拡大する可能性があり、次世代システムそしてそれを活用する産業の発展に貢献できると笠原氏は考えているからだ。

 「OpenPOWER Foundationに参加することで、最新の、そしてこれまでは知り得なかった情報を積極的に得ていきたいと考えていますし、IBMとの関係も強化していきたい。また、我々もOSCARに関する情報をOpenPOWER Foundationの参加メンバーに発信することで、国境や組織の壁を越えてOSCARのテクノロジが活用されていく基盤を作れればと期待しています」と、笠原氏は意気込む。

 また、笠原氏はOpenPOWER Foundation参加によって描く未来を次のように語ってくれた。

 「現状のOSCARでも、1000コア程度のシステムなら、処理性能をリニアに上げ、消費電力を下げていけます。ただし、100万コアのシステムでそれができるわけではありません。POWERのように、分散共有メモリアーキテクチャをサポートしたシステムならば、OSCARを活用することでいずれは100万コア、あるいはそれ以上のコアの性能と電力効率を大きく高められるはずです。そんな未来を、IBM、そしてPOWERと共創していきたいと考えています」(笠原氏)

「POWER+OSCAR」なら、Googleのデータセンターの電力効率を確実に上げられます」

 OpenPOWER Foundationには、米グーグルが創設メンバーとして参加しているが、100万コア以上でコア性能と電力効率を実現できるとなれば、データセンターの省電力化・高性能化を追求しているグーグルも興味を抱くのではないか――そう笠原氏に問い掛けてみた。

 「理論上、OSCARならばグーグルのデータセンターの電力効率を確実に上げられます。しかもOSCARのようなテクノロジは他になく、可能性はグーグルだけではないと考えています」(笠原氏)

 モバイル機器から家電製品、自動車、医療機器、ロボットなど、あらゆるものが情報を受発信し、企業間や個人間のコミュニケーションも、モバイルなどのさまざまなデバイスで頻繁に行われるようになった今、まさに今私たちはビッグデータ時代にいる。そして、それを処理するITインフラやコンピューターは、これまで以上のスピードで大容量データを電力効率よく処理することがまさに求められている。この傾向は今後も止まることはないだろう。そうした課題を一挙に解決し得る仕組みとして、OSCARとビッグデータ処理向けのアーキテクチャを持つPOWERの組み合わせが生み出すイノベーションから目が離せそうにない。

OpenPOWER Foundationとは――オープンイノベーション指向でコミュニティを拡大するPOWER

 OpenPOWER Foundationは、POWERテクノロジを活用し、これまでのアーキテクチャでは実現できない新たなITインフラを開発と、次世代データセンターにおけるイノベーションを創出することを目的に、2013年にグーグル、IBM、メラノックス、エヌビディア、タヤン(Tyan)により立ち上げられたオープンな開発コミュニティである。IBMは2014年7月にPOWER8搭載サーバーのファームウエアをOSSとして公開、コミュニティメンバーによる新しいITインフラの開発を可能にした。OpenPOWER Foundationには既に110*を超えるメンバーが参加し、国境や組織の壁を越えて参加企業間で技術情報連携を図ることで、1社による開発では決してなし得ないスピードで、新たな価値が創出されている。

 2015年3月に開催された「OpenPOWERサミット」においては、システム、ボード、カードにわたる10を超えるハードウエアソリューションが発表され、POWERとGPUを組み合わせることによる、Javaアプリケーション実行の性能向上や、OpenPOWERハイパフォーマンスコンピューティングサーバーの発表など、既にその成果は具現化されている。


OpenPOWER Foundation参加企業・団体

*2015年3月23日現在。最新のメンバーリストは、www.openpowerfoundation.orgをご確認ください。




Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本アイ・ビー・エム株式会社
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2015年6月30日

関連リンク

今回取材に応じていただいた笠原氏が所属する「グリーン・コンピューティング・システム研究開発センター」のWebサイト。研究活動の内容などを紹介している。

本稿で取材した笠原氏が参加するOpenPOWER FoundationのWebサイト。参加メンバーの一覧や技術情報なども公開されている。

最新POWERプロセッサーを搭載したPower Systemsの製品情報。インメモリデータベースと組み合わせたビッグデータ分析や「サービスカタログ」を使ったクラウド基盤の事例なども。

オープン指向を明確化したPower Systemsは、UNIXだけでなくLinux OSにも適したプラットフォームになっている。x86からPower Systemsへの移行のベストプラクティスなども紹介。

関連ホワイトペーパー

ビッグデータ分析は、限定されたユーザーによる利用から、企業内の多くのユーザーが使う分析基盤として、より多角的なデータを扱うようになってきた。データ分析ソリューションとして進化を続けるビッグデータプラットフォームに、いま求められているものとは何か。

ビッグデータに対応するテクノロジーの代表例として、高速処理が可能なNoSQLとHadoopへの関心が高まっている。従来の処理方式の限界を超えるこれらの最新技術を、現実のデータ解析に生かすにはどのような措置が必要となるのだろうか。

ページトップに戻る