解説

90nmプロセス製造の新Pentium 4の損得勘定

2. Prescottは速いのか遅いのか

元麻布春男
2004/02/06

解説タイトル

 このような特徴を持つPrescottだが、性能向上につながると思われるポイントは、2倍に増量されたキャッシュ・メモリ、新しいSSE3命令セットというところだ。キャッシュ・メモリの増量は即効性があるが、SSE3は対応アプリケーション待ちとなる。とはいえ、早くもペガシスが同社製MPEG2エンコーダ・ソフトウェアであるTMPGEncでSSE3対応を表明し、すでにベータ・テストを開始している(ペガシスの「SSE3の最適化について」)。マルチメディア系アプリケーションを中心に、意外と早期に対応アプリケーションが登場してくる可能性もある。その一方で分岐予測ユニットの改良には性能向上要因と性能低下要因の両方が含まれており、どちらが強く出てくるのか興味があるところだ。

Prescottコアの性能を計測する

 こうしたマイクロアーキテクチャの変更については、簡単なベンチマークだけで分かるほど単純ではないが、Pentium 4-3.20E GHz(Prescottコア)を試用する機会を得たので、NorthwoodコアのPentium 4-3.20GHzと比較してみることにした。比較に用いたシステムの構成は表2のとおりである。今回用いたマザーボードは、Intel 875Pチップセット・ベースのIntel製D875PBZで、最新のリビジョン(C26680-301)のものを用いている。Prescottは、基本的にIntel 865/875搭載のマザーボードならば利用可能であるとされている。ただし、BIOSや電源機能などによっては対応できないマザーボードもあると思われるので、各ベンダのホームページなどで対応状況を確認していただきたい。Intel製D875PBZについては、2003年秋以降に出荷されたもの(リビジョンC26680-206あるいはC27085-207以降)であれば利用可能なようだが、BIOSをP20以降のバージョンにアップデートする必要がある。

マザーボード D875PBZ Rev 301
メモリ 512Mbytes×2(DDR-400 CL=3)
グラフィックス機能 ATI RADEON 9700 Pro
ディスプレイ・ドライバ Catalyst 4.1
ハードディスク Seagate Barracuda ATA IV
OS Windows XP SP1日本語版
Windows XP SP1英語版(SYSmark実行時のみ)
HTテクノロジ 有効
表区切り
表2 ベンチマーク・テストに用いたシステムの概要

 実施したベンチマーク・テストとその結果の詳細は、次ページの「ベンチマーク・テストの結果」を参照していただきたい。表を見ると分かるが、多くのテストで両者に大きな差は出なかった。SYSmark 2004とSPECviewperf 7.1.1はPrescottに有利に働いているが、逆にPCゲームのComanche 4とPCMark04のCPU Test SuitはNorthwoodに有利なスコアが出ている。SYSmark 2004とSPECviewperf 7.1.1に共通するのは、データセットが大きいということである。また複数アプリケーションが同時実行されるSYSmark 2004の場合、HTテクノロジも関係してくる可能性があるが、基本的には増量された2次キャッシュの効果が現れているのではないかと思われる。逆にPC Mark04のCPU Test SuitやComanche 4は、データセットがあまり大きくないハズだ。

大きなグラフへ
SYSmark 2004の結果
 
大きなグラフへ
PCMark04の結果

 このベンチマーク・テストの結果からいえることは、必ずしもPrescottコアの性能はNorthwoodコアを上回るものではない、ということである。もしPrescottコアで即効性のある1次/2次キャッシュ・メモリの増量が施されていなければ、もっと不利な結果となっただろう。Prescottコアで行われたマイクロアーキテクチャの改良は、キャッシュ・メモリの増量(と今回のベンチマーク・テストでは使われていないSSE3)を除くと、現時点では性能面でマイナスに働いているように思われる。

 とはいえ企業内のクライアントPCとして利用する場合、Microsoft Officeを始めとするビジネス・アプリケーション・ベンチであるOffice Productivityと、AdobeやMacromediaのマルチメディア・アプリケーションが主体となるInternet Content Creationの2つで構成されるSYSmark 2004において、Prescottの性能が若干ながら高い点が気になるだろう。NorthwoodコアとPrescottコアでは、前述のようにプロセッサ単体の価格差はない。価格が同じならば、Prescottコアを選んだ方がよい結果を得られるかもしれない。

Prescottはクロック至上主義か?

 このようにPrescottコアでは、改良を施していながら、大幅な性能向上が見られない。なぜIntelはそのような改良を行ったのだろうか。恐らくその理由は、将来に向けたスケーラビリティの確保だろう。いい換えれば、将来にわたって動作クロックを引き上げることが可能なように、クロック信号伝達の効率化やパイプライン段数の増加を行ったと思われる。1次キャッシュを増量したのは、こうした変更に伴う一時的な性能低下を補償する(より直接的には性能でNorthwoodコアを明らかに下回らないようにする)ための措置かもしれない。例えば、パイプライン段数の増加は、2003年2月付の「Prescott New Instructions Software Developer's Guide」と呼ばれる文書ですでに明記されており、当初から計画されていたものであることがうかがえる。恐らく1次キャッシュの増量も、最初から決められていたのだろう。

 そう考えると、表1のところで触れた価格にも納得がいく。Northwoodコアの3.40GHzとPrescottコアの3.40E GHzが同じ価格なのは、この2つのプロセッサがユーザーに与える価値(究極的には性能)がほぼ等しいからである。NorthwoodコアとPrescottコアでは、トランジスタ数が大きく異なるが、Intelはトランジスタを売っているのではなく、マイクロプロセッサとしての価値を売っているからこそ両者の価格が同じなのだ。

 逆にいえば、価値が同じということは、両者は互いに代替可能ということである。もちろんここでいっているのは、マザーボード互換性(動作電圧、消費電力など)といった技術的な代替性ではなく、商品の位置付けとしての代替性のことだ。Pentium 4-2.80A GHzはプレスリリースにも取り上げられない不思議な新製品だが、Pentium 4-2.80GHzの代替品と理解すればよいのかもしれない。

 上述したように、Intelは3カ所工場で300mmウエハと90nmプロセスを採用してPrescottコアの立ち上げを行う。このかつてない規模の量産体制を背景に、現時点でPrescottコアでの対応が難しい3.40GHzを除き、既存のNorthwoodコアを積極的にコスト面で有利なPrescottコアに置き換えていこうというつもりなのだろう。2003年11月に開催したアナリスト・ミーティングでIntelのポール・オッテリーニ(Paul Otellini)社長は、2004年第2四半期末(6月末)までに、デスクトップPC向けCeleronの40%がPrescottコア・ベースになると述べている(「解説:アナリスト・ミーティングに見るAMDとIntelの2004年戦略」)。Celeronのリリース計画はまだ不明だが、Pentium 4-2.80GHzを2.80A GHzで、Pentium 4-2.80C GHzを2.80E GHzで、Pentium 4-3.20GHzを3.20E GHzで、といった具合に製造原価的に有利と思われる90nmプロセス製造に置き換えていくのだろう。そのために、性能は同等で構わないということなのかもしれない。もちろん、新製品が性能的に大きく下回るのはイメージ的にマイナスとなるため、最低限、同等である必要はある。

 このように性能的に下回ってはまずい、という判断が強く働いたことは過去にもある。それは初代Pentium 4(Willametteコア)がリリースされたときのことだ。Willametteはクロック当たりの性能でPentium IIIにおよばないと批判された。しかし、トータルでの性能で下回ることのないよう、Willametteの動作クロックは1.4GHzからスタートするように決定されたといわれている。クロック当たりの性能を批判されようと、動作クロックが3GHzを超えるプロセッサを作るには、Pentium IIIではなくPentium 4でなければならなかった。同様に、4GHzのプロセッサを作るには、NorthwoodコアではなくPrescottコアでなければならないわけだ。もちろん、これはIntelの都合であって、ユーザーの都合ではない。少なくとも動作クロックが同じであれば、NorthwoodコアのユーザーがPrescottコアに買い換える意味はほとんどない。Willametteコアがそうであったように、クロックの低いPrescottコアはユーザーにとってメリットがあまりないからだ。それでも、いずれPentium 4はすべてPrescottコアになってしまうことも間違いないことなのである。

 次ページでは、参考までにSYSmark04と3DMark03以外の実施したベンチマーク・テストの結果を示す。

  関連記事
アナリスト・ミーティングに見るAMDとIntelの2004年戦略
 
  関連リンク
Prescott New Instructions Software Developer's Guide英語
SSE3の最適化について
 

 INDEX
  [解説] 90nmプロセス製造の新Pentium 4の損得勘定
    1.Prescottの拡張ポイント
  2.Prescottは速いのか遅いのか
    3.Prescottのベンチマーク・テストの結果
 
目次ページへ  「System Insiderの解説」


System Insider フォーラム 新着記事
  • Intelと互換プロセッサとの戦いの歴史を振り返る (2017/6/28)
     Intelのx86が誕生して約40年たつという。x86プロセッサは、互換プロセッサとの戦いでもあった。その歴史を簡単に振り返ってみよう
  • 第204回 人工知能がFPGAに恋する理由 (2017/5/25)
     最近、人工知能(AI)のアクセラレータとしてFPGAを活用する動きがある。なぜCPUやGPUに加えて、FPGAが人工知能に活用されるのだろうか。その理由は?
  • IoT実用化への号砲は鳴った (2017/4/27)
     スタートの号砲が鳴ったようだ。多くのベンダーからIoTを使った実証実験の発表が相次いでいる。あと半年もすれば、実用化へのゴールも見えてくるのだろうか?
  • スパコンの新しい潮流は人工知能にあり? (2017/3/29)
     スパコン関連の発表が続いている。多くが「人工知能」をターゲットにしているようだ。人工知能向けのスパコンとはどのようなものなのか、最近の発表から見ていこう
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

System Insider 記事ランキング

本日 月間