解説複雑なマルチコア時代のサーバ選びデジタルアドバンテージ 小林 章彦2007/02/10 |
|
|
インテルは、2006年11月15日にクワッドコアを採用するサーバ向けプロセッサIntel Xeon 5300番台を発表した。サーバ向けデュアルコア製品を2005年10月11日に投入しているので、約1年でデュアルコアからクワッドコアへ進化したことになる。いまのところ、2007年中にクワッドコアからオクトコア(8コア)に移行する計画はないようだが、1つのプロセッサ・パッケージ内に実装されるコアの数は増えていく傾向にある。
1つのプロセッサ・パッケージに実装されるコア数が増えることで、これまでのIntel Xeon(デュアルプロセッサ対応)とIntel Xeon MP(4ウェイから32ウェイ対応)の関係がより一層複雑になっていく。例えば、クワッドコア採用のIntel Xeonのデュアルプロセッサ構成と、デュアルコア採用のIntel Xeon MPの4ウェイ・サーバではコア数が同数になり、性能的にも拮抗することが予想されるからだ。またIntel Xeon同士においても、デュアルコアのデュアルプロセッサ構成とクワッドコアのシングルプロセッサ構成で同様のことが起きる。
このようにサーバ向けプロセッサでは、マルチコア化によってプロセッサの選択が複雑になってくる。こうした傾向はIntel製プロセッサだけでなく、AMD、Sun Microsystems、IBMの各プロセッサにも同じことがいえる。そこで、今回はマルチコア時代のサーバ選択について解説する。
マルチコア化の背景
これまで、プロセッサの性能向上は主に動作クロックを引き上げることで実現されてきた。例えば、初代のPentiumは当初動作クロック60MHz/66MHzでリリースされたが、第2世代では90MHz/100MHzとなり、最終的に233MHz(デスクトップPC向け、ノートPC向けには300MHzの製品がリリースされている)まで引き上げられている。この間、製造プロセスは、当初の0.8μmから第2世代で0.6μmになり、最終的には0.35μm(ノートPC向けでは0.25μmも使われた)にまで微細化されている。同様にPentium IIIにおいても、0.25μmプロセスによる450MHz/500MHzからスタートし、最終的には0.18μmプロセスによる1GHz(ラックマウント・サーバ向けには動作クロック1.4GHzのPentium IIIがリリースされている)まで動作クロック(性能)が向上している。
このように、これまでIntelは同じマイクロアーキテクチャのプロセッサを複数世代のプロセス技術を用いて製造し、動作クロックの向上を実現していた。従来はプロセス技術が1世代進むと、同じ設計でダイ・サイズが縮小できる(歩留まりが引き上げ可能)ほか、消費電力の低減やトランジスタのスイッチング速度の向上(動作クロックが引き上げ可能になる)などの恩恵があった。しかし90nmプロセス製造に移行したPentium 4では、消費電力が大幅に上がってしまうなどの問題から、微細化したにもかかわらず、動作クロックを向上させることができなくなってしまった。実際、デスクトップPC向けのPentium 4では、0.13μm(130nm)プロセスによる最高動作クロックが3.40GHzであったのに対し、90nmプロセスに微細化しても3.80GHzにまでしか引き上げられなかった。
そこで、Intelはこれまでの動作クロックによる性能向上から、複数のコアを単一のプロセッサ・パッケージに同梱して並列性を高めることで性能を向上させる方針へ転換した。工場の製造ラインにたとえると分かりやすいかもしれない。これまでは1つの製造ラインで製品を作っていたため、製品の製造個数を増やすためには、製造ラインを動かすスピード(動作クロック)を引き上げるしかなかった。しかし製造ラインを動かすスピードが限界となったため、製造ラインを増やすことで、同じ時間で製造できる製品の個数を増やすようにした、というわけだ。幸いなことに、サーバではこれまでもマルチプロセッサ構成による性能向上が行われてきており、特にソフトウェア面でプロセッサ数を増やすことが性能向上に比例するしくみが成り立っている。マルチコアは、これまでのマルチプロセッサが、1つのプロセッサ・パッケージで実現されていると考えれば分かりやすい。
性能と価格のみに注目すれば
前述のようにクワッドコア(Intel Xeon 5300番台)のデュアルプロセッサ(DP)・サーバとデュアルコア(Intel Xeon 7100番台)の4ウェイ・サーバでは、コアの数が8個と同じになる。Intel Xeon 7100番台(以下、Intel Xeon MP 7100番台)は、これまでIntel Xeon MPと呼ばれてきたもので、4ウェイから32ウェイのマルチプロセッサ(MP)向けプロセッサだ。この両プロセッサをインテルが公表しているベンチマーク・テストの結果から比較すると、以下のグラフのようになる。
Intel Xeon X5355とIntel Xeon MP 7140Mとの性能比較(出典:インテル公表のインテル Xeon プロセッサー、デュアルコア インテル Xeon プロセッサー 7100 番台のパフォーマンスより) |
インテルが公表しているベンチマーク・テストの中から比較可能な4つのテストを取り上げた。グラフは、Intel Xeon X5355(動作クロック2.66GHz、2次キャッシュ4Mbytes×2、FSB 1333MHz)を1とした場合のIntel Xeon MP 7140M(動作クロック3.40GHz、3次キャッシュ16Mbytes、FSB 800MHz)の性能である(グラフ中の値はベンチマーク・テストのスコア)。詳細ならびにテスト・サーバの構成については、インテルのホームページを参照してほしい。 |
このようにIntel Xeon X5355は整数演算スループットとJavaの性能が高く、一方のIntel Xeon MP 7140MはデータベースとERPの性能が高いという結果になった。この性能の違いは、1つにはコアのマイクロアーキテクチャが異なるという理由が挙げられる。Intel Xeon 5300番台がCoreマイクロアーキテクチャなのに対し、Intel Xeon MP 7100番台が1世代前のNetBurstマイクロアーキテクチャである。またIntel Xeon MP 7100番台は16Mbytesの3次キャッシュが実装されていることから、データベースやERPといったデータ参照が多い用途で高い性能を示したものと思われる。このように用途による性能差はあるものの、両プロセッサの性能差は20%程度であり、 クワッドコアのDPサーバであっても、4ウェイ・サーバと同等の十分に高い性能が実現可能であることが分かる。
一方システム価格となると、Intel Xeon MP 7100搭載サーバの方が圧倒的に高い。例えばデル製のサーバで比較すると、Intel Xeon X5355(動作クロック2.66GHz、2次キャッシュ 4Mbytes×2、FSB 1333MHz)をデュアルプロセッサ構成にしたPowerEdge 2950の67万円(スタンダード・パッケージ)に対し、Intel Xeon MP 7140M(動作クロック3.40Hz、16Mbytes 3次キャッシュ、FSB 800MHz)を4ウェイとしたPowerEdge 6850は365万1000円(スタンダード・パッケージ)と、同じ8コアを搭載するシステムでの比較でも5倍以上の価格となる。
PowerEdge 2950 | PowerEdge 6850 | |
搭載プロセッサ名 | Intel Xeon X5355 | Intel Xeon MP 7140M |
コア数 | 4 | 2 |
最大搭載可能プロセッサ数 | 2 | 4 |
動作クロック | 2.66GHz | 3.40GHz |
2次キャッシュ容量 | 4Mbytes×2 | 1Mbytes×2 |
3次キャッシュ容量 | なし | 16Mbytes |
FSB | 1333MHz | 800MHz |
システム価格(8コア時) | 67万円(スタンダード・パッケージ) | 365万1000円(スタンダード・パッケージ) |
Intel Xeon X5355とIntel Xeon MP 7140Mのシステム価格の比較 |
拡張性やRAS(信頼性、可用性、保守性)機能の面で、PowerEdge 6850とPowerEdge 2950は大きな差があるので、PowerEdge 6850が一概に高いとはいえない。だが性能とサーバ本体の価格だけに着目すれば、PowerEdge 2950のコストパフォーマンスは非常に高いことが分かる。つまり、これまで性能的に4ウェイ以上が必要とされていた用途であっても、場合によってはクワッドコアのDPサーバでカバー可能であるわけだ。もちろん、一般的に4ウェイ・サーバの方が搭載メモリ容量やハードディスク数、拡張スロットの数などが多いので、システム価格が高くてもデュアルコアの4ウェイ・サーバが必要となる用途もあるだろう。
Intel Xeon 5300番台 | Intel Xeon MP 7100番台 | |
インテル キャッシュ・セーフ・テクノロジー |
×
|
○
|
ECCメモリのサポート |
○
|
○
|
PCI ExpressのRAS機能のサポート |
○
|
○
|
メモリのホットプラグ |
×
|
○
|
ハードウェア・パーティショニング |
×
|
○
|
Intel Xeon 5300番台とIntel Xeon MP 7100番台のRAS機能の違い |
なおIntel Xeon MPに対しても、2007年後半にはクワッドコアが投入される予定だ。前述のようにIntel Xeon MP 7100番台は未だにNetBurstマイクロアーキテクチャである。Intelは、2007年後半にCoreマイクロアーキテクチャを採用した「Tigerton(開発コード名:タイガートン)」と呼ばれるクワッドコアのMPサーバ向けプロセッサをリリースする。これにより、4ウェイ・サーバの性能が大幅に向上し、再びDPサーバに対して性能的な優位を得ることになる。
ただIntel Xeon MPは、Intel Xeonに比べて新しいマイクロアーキテクチャの採用やコア数の拡張が一世代遅れる傾向にあるため、将来Intel Xeonがオクトコア(8コア)になると、再び性能が拮抗する時期が生じるかもしれない。このように、DPサーバかMPサーバという違いだけでなく、これからは搭載可能なプロセッサのコア数を含めた性能を検討する必要がある。また単にコア数だけでなく、データベース・サーバなどの用途では2次キャッシュ、3次キャッシュの容量も性能に大きく影響を与えるので、この点も含めた選択の検討が必要になる。
デュアルコアかクワッドコアか
ここまで、Intel XeonとIntel Xeon MPの比較を行ったが、同じIntel Xeonでも、デュアルコアとクワッドコアの選択に迫られることがある。現時点(2006年12月24日付のプロセッサ価格)の価格は以下のようになっており、クワッドコアの方が性能に比べて、若干割安に設定されている。
コア数 | プロセッサ・ナンバー | 動作クロック | 2次キャッシュ容量 | FSB | 価格 | 価格(1ドル121円で換算) |
クワッドコア | X5355 | 2.66GHz | 8Mbytes | 1333MHz |
1172ドル
|
14万1812円
|
E5345 | 2.33GHz | 8Mbytes | 1333MHz |
851ドル
|
10万2971円
|
|
E5320 | 1.86GHz | 8Mbytes | 1066MHz |
690ドル
|
8万3490円
|
|
E5310 | 1.60GHz | 8Mbytes | 1066MHz |
455ドル
|
5万5055円
|
|
デュアルコア | 5160 | 3.00GHz | 4Mbytes | 1333MHz |
851ドル
|
10万2971円
|
5150 | 2.66GHz | 4Mbytes | 1333MHz |
690ドル
|
8万3490円
|
|
5140 | 2.33GHz | 4Mbytes | 1333MHz |
455ドル
|
5万5055円
|
|
5130 | 2.00GHz | 4Mbytes | 1333MHz |
316ドル
|
3万8236円
|
|
5120 | 1.86GHz | 4Mbytes | 1066MHz |
256ドル
|
3万976円
|
|
5110 | 1.60GHz | 4Mbytes | 1066MHz |
209ドル
|
2万5289円
|
|
5148 | 2.33GHz | 4Mbytes | 1333MHz |
519ドル
|
6万2799円
|
|
2006年12月24日付けのIntel Xeonの価格 |
そのため上記の価格と性能を基に考えると、DPサーバを導入する場合、必要となる性能と予算によって、以下の順で選択するのがコストパフォーマンスがよさそうだ。
- Intel Xeon 5110/5120/5130(デュアルコア)
- Intel Xeon E5310以降(クワッドコア)
- Intel Xeon E5310以降×2(クワッドコア)
デュアルコアのIntel Xeon 5140は、クワッドコアのIntel Xeon E5310と同価格で、コア単体の性能は高い。しかしトータルのプロセッサ性能となると、クワッドコアのIntel Xeon E5310の方が高くなるため、上記の順番となる。同様に同価格のIntel Xeon 5150とIntel Xeon E5320、Intel Xeon 5160とIntel Xeon E5345もクワッドコアの方が性能的に優位となっている。ただし、コアの数よりコア単体の性能が大きく影響するような用途では、デュアルコアのIntel Xeon 5140/5150/5160の方を選択した方がよい。
また以前にデュアルコア・プロセッサ×1個の構成で導入したDPサーバのプロセッサ性能を増強する場合も、デュアルコア・プロセッサ×2個の構成にするか、クワッドコア・プロセッサ×1個の構成にアップグレードするかの選択が可能だ(そのサーバでクワッドコアのIntel Xeonがサポートされていることが前提となるが、デュアルコアに対応したDPサーバならば多くの場合クワッドコアもサポート可能だ)。同じコストならば、デュアルコアのDP構成にした方が高い性能を得られる。例えば、最初からIntel Xeon 5140×1個を搭載したサーバならば、455ドル(約5万5055円)の追加でデュアルプロセッサ化が可能だ。一方、クワッドコアで同等の性能を得るには、Intel Xeon E5345に置き換える必要があり、851ドル(約10万2971円)が必要になる。
しかしデータベースなどをプロセッサ・ライセンスで利用しているような場合、DP構成にすると2プロセッサ分のライセンスが必要になるが、クワッドコアのシングルプロセッサならば追加ライセンスの購入が不要になる分、クワッドコアへ置き換えた方が安くなる。例えば、SQL Server 2005 Workgroup Editionのプロセッサ・ライセンスの推定小売価格は45万100円なので、SQL Server 2005の追加ライセンスが不要なクワッドコアへの置き換えの方が圧倒的に性能・価格ともに有利となる。
またクワッドコアにアップグレードした場合は、プロセッサ・ソケットが1つ空いたままとなるので、さらにアップグレードできる余地も生まれる。このようにマルチコア化によって、同じプロセッサを足す、もしくはより動作クロックの高いプロセッサに置き換える、といった従来の性能向上方法に加え、コア数の多いプロセッサに置き換えるという方法が選択可能となっている。コア数の多いプロセッサへの置き換えは、上述のようにプロセッサ・ライセンスの追加購入が不要になり、場合によっては非常に高いコストパフォーマンスを実現することになる。
■
マルチコア時代の到来によって、サーバ選びは複雑さが増している。必要とされる性能を実現する組み合わせが、プロセッサの数と動作クロックに、コア数という要素が加わったためだ。さらに価格改定や新製品の投入によって、上記の前提が時期刻々と変化していくことになる。
また、今回はプロセッサの性能と価格にのみ着目したが、実際にサーバを選択する上では、拡張性やRAS機能、消費電力など、検討すべき要素はほかにもある。そのため、システム導入担当者はプロセッサやサーバに対する知識に乏しいと、無駄に高いサーバを導入してしまったり、サーバの性能が足りずにまるごと買い直しとなったりする可能性がある。導入前には、プロセッサのロードマップや、マルチコアの動向などを十分に調べて上でサーバを選択した方がよい。
関連リンク | |
インテル Xeon プロセッサー | |
デュアルコア インテル Xeon プロセッサー 7100 番台 |
「System Insiderの解説」 |
- Intelと互換プロセッサとの戦いの歴史を振り返る (2017/6/28)
Intelのx86が誕生して約40年たつという。x86プロセッサは、互換プロセッサとの戦いでもあった。その歴史を簡単に振り返ってみよう - 第204回 人工知能がFPGAに恋する理由 (2017/5/25)
最近、人工知能(AI)のアクセラレータとしてFPGAを活用する動きがある。なぜCPUやGPUに加えて、FPGAが人工知能に活用されるのだろうか。その理由は? - IoT実用化への号砲は鳴った (2017/4/27)
スタートの号砲が鳴ったようだ。多くのベンダーからIoTを使った実証実験の発表が相次いでいる。あと半年もすれば、実用化へのゴールも見えてくるのだろうか? - スパコンの新しい潮流は人工知能にあり? (2017/3/29)
スパコン関連の発表が続いている。多くが「人工知能」をターゲットにしているようだ。人工知能向けのスパコンとはどのようなものなのか、最近の発表から見ていこう
|
|