インテルが発表したメニーコア時代のコプロセッサ「Xeon Phi」：初代地球シミュレータを2ラックで

インテルが、並列処理向けのコプロセッサを発表。x86アーキテクチャによるメニーコアはGPGPUによる並列処理よりも、既存のソフトウェア資産が活用できるという。

» 2012年11月13日 11時00分公開

[原田美穂，＠IT]

Xeon Phiのダイ

　インテルは2012年11月12日、コプロセッサ「Xeon Phi」を発表した。2013年1月28日にXeon Phi 5110Pが、2013年上半期中にはさらに3100ファミリーが投入される予定だ。

　現時点で、国内メーカーではデル、HP、日立、富士通、NEC、IBM、SGI、クレイがXeon Phi搭載製品の出荷を予定している。

　5110Pはピーク時性能として1.011TFLOPSの倍精度演算が可能で、8GB GDDR5メモリを搭載、320Gbpsの帯域幅を持つ。60コア、240スレッドの並列が可能だ。一方の3100ファミリは1TFLOPSの倍精度演算性能、6GB GDDR5メモリを搭載、240Gbpsの帯域幅となっている。

　「40TFLOPSの処理性能であった、320ラックの初代地球シミュレータ（2002年稼働）と同等の性能を2ラックで実現できる」（インテルクラウド・コンピューティング事業本部事業開発本部本部長岡崎覚氏）

Intel Phi 5110P

Intel Phiを搭載したサーバ機 Xeon E5 2690プロセッサ2基、Intel Phi 5110P4基で4.4TFLOPSの性能を出す

　物理シミュレーションなどの工学系の計算では、CやC++、Fortranなどの言語で書かれた、並列処理を前提としたものが少なくない。

　最近では、NVIDIAが提供するCUDAライブラリを採用した並列プログラムなど、GPGPUによる並列プログラミングが注目を集めている。処理性能を高められる一方で、既存資産の移植にはCUDAプログラミングのスキルが必要となる。

　Xeon Phiコプロセッサは、Xeon向けと共通の開発環境で利用できる点が特徴となっている。このため、実行するだけならば、旧資産をほぼそのまま流用可能だという。無論、vTuneなどのチューニングソフトウェアを活用し、より処理性能を高めることも可能だ。この部分をGPGPU向けに大幅に改編することなく、そのまま実施できる点が利点となっている。