解説

90nmプロセス製造の新Pentium 4の損得勘定

1. Prescottの拡張ポイント

元麻布春男
2004/02/06

解説タイトル

 Intelは2月2日(日本時間2月3日)、開発コード名「Prescott(プレスコット)」で呼ばれていた90nmプロセス製造によるプロセッサを含む、7製品のPentium 4を発表した。当初の予定では90nmプロセス製造によるプロセッサは、2003年内に出荷される予定であった。しかし、消費電力などの問題から事実上の延期になっていた。公式には2003年末にOEM向けの出荷を開始したことになっているが、搭載したPCが出荷されていないことから、かなり限定的な出荷であったことがうかがえる。予定よりもスケジュールが遅れていることは間違いない。

 Prescottのリリースを待って、次回導入するPCを決めようと考えていた企業のクライアントPC導入担当者も多いかもしれない。ここでは、Prescottコアの新Pentium 4を既存のNorthwood(ノースウッド)コアと比較し、性能を比較してみた。新Pentium 4は、「買い」なのか「待ち」なのかの検討材料の1つとしていただきたい。

意外にお得な新Pentium 4の価格設定

 実は、今回発表された7種のプロセッサのすべてが、90nmプロセス製造のPentium 4ではない。表1は今回発表された7製品のおおまかな仕様と米国での価格(大口向け1000個ロット時)をまとめたものだが、130nm(0.13μm)プロセスによるプロセッサが2種類含まれている。どうやらこの2種は、もともとIntelの計画にはなかったもののようだ。なお、表にあるPentium 4-2.80A GHzは新製品で、2004年2月1日付の価格表(Intel Processor Pricing)とデータシートに掲載されているにもかかわらず、なぜかプレスリリースには記載されていなかった。

プロセス・ルール 2次キャッシュ 3次キャッシュ トランジスタ数 FSB HT対応 TDP 米国OEM価格
HTテクノロジPentium 4 Extreme Edition-3.40GHz 130nm 512Kbytes 2Mbytes 1億7800万個 800MHz 102.9W 999ドル
HTテクノロジPentium 4-3.40 GHz 130nm 512Kbytes なし 5500万個 800MHz 89W 417ドル
HTテクノロジPentium 4-3.40E GHz 90nm 1Mbytes なし 1億2500万個 800MHz 103W 417ドル
HTテクノロジPentium 4-3.20E GHz 90nm 1Mbytes なし 1億2500万個 800MHz 103W 278ドル
HTテクノロジPentium 4-3E GHz 90nm 1Mbytes なし 1億2500万個 800MHz 89W 218ドル
HTテクノロジPentium 4-2.80E GHz 90nm 1Mbytes なし 1億2500万個 800MHz 89W 178ドル
Pentium 4-2.80A GHz 90nm 1Mbytes なし 1億2500万個 533MHz × 89W 163ドル
 
Northwoodコア(一部)
HTテクノロジPentium 4-3.20 GHz 130nm 512Kbytes なし 5500万個 800MHz 82W 278ドル
HTテクノロジPentium 4-2.80C GHz 130nm 512Kbytes なし 5500万個 800MHz 69.7W 178ドル
Pentium 4-2.80 GHz 130nm 512Kbytes なし 5500万個 533MHz × 68.4W 163ドル
表区切り
表1 今回発表されたPentium 4の主な仕様と価格

 このPentium 4-2.80A GHzに限らず、今回の発表は少々変則的であった。まずIntelが新しい製造プロセスによるメインストリーム向けプロセッサの新製品をリリースするというのに、正式な発表会は開かれなかった(記者向けの事前説明会は開催されたが)。次にIntelは、基本的に発表時点で製品を出荷するとしているにもかかわらず、90nmプロセス製造のPentium 4、特に最高クロックである3.40E GHzの入手性が極端に悪い。Intelが発表したプレスリリースにも、同プロセッサを搭載したシステムの出荷が2004年第1四半期後半になると、わざわざ断り書きがあるほどだ(つまり発表時点においてほとんど出荷できていないとうことを意味する)。Prescottの発表遅延を招いた消費電力の問題は、まだ完全には解消していない可能性がある。それを物語るかのように、PrescottのTDP(熱設計時消費電力)が決して低くはなっていないことが、この表から読み取れる。ちなみに動作電圧は1.25V〜1.4Vとなっており、Northwoodに比べ若干下がっている。

 この表1でもう1つ注目してほしいのは、それぞれのプロセッサの価格設定だ。2Mbytesの3次キャッシュを内蔵するPentium 4 Extreme Editionの価格が飛びぬけて高いのは別として、90nmプロセス製造と130nmプロセス製造によるプロセッサで価格差が設けられていないことに気付く。例えば、同時に発売されたPentium 4-3.40GHz(130nm:Northwoodコア)とPentium 4-3.40E GHz(90nm:Prescottコア)の価格はともに417ドルに設定されている。すでに発表済みのプロセッサのうち、特にバリエーションの豊富な2.80GHzのプロセッサの場合、2.80C GHz(130nm:Northwoodコア)と2.80E GHz(90nm:Prescottコア)の価格が同じ178ドルで、2.80A GHz(90nm:Prescottコア)と2.80GHz(130nm:Northwoodコア)の価格が同じ163ドルである。178ドルのプロセッサに共通するのはHTテクノロジ対応と800MHz FSB、163ドルのプロセッサに共通するのはHTテクノロジ非対応と533MHz FSBだ(HTテクノロジについては、「解説:Hyper-ThreadingテクノロジはPCに革命を起こすか?」参照)。つまりPrescottは、2次キャッシュが1Mbytesに増量されたにもかかわらず、それによる値上げはない。これが何を示すのか、もう少し考えてみる必要があるが、その前にまずPrescottとNorthwoodの違いをまとめておこう。

Prescottコアにおける改良点

 前述のように、Prescottコアで最も大きく変わったのは、製造プロセスが90nmへ微細化されたことだ。これに伴い、歪シリコン技術や低誘電率(Low-k)素材による層間絶縁膜などが導入されている(Low-kについては、「頭脳放談:第9回 銅配線にまつわるエトセトラ」参照)。歪シリコンは、シリコンを歪ませることで原子間に隙間を作り、電子の移動速度を向上させる技術である。またLow-k層間絶縁膜は配線間の寄生容量を減らすことで配線遅延を軽減する技術だ。いずれも半導体の高速動作に不可欠となりつつあるものである。Prescottは、この90nmプロセス(7層メタル・レイヤ)を用いて、300mmウエハで量産される(ウエハについては、「頭脳放談:第13回 300mmウエハは2倍お得」参照)。Intelは、90nmプロセスによる量産が可能な300mmウエハ対応のファブ(工場)を米国オレゴン州(D1C)と米国ニューメキシコ州(Fab 11X)に保有しており、間もなく3番目の工場としてアイルランド(Fab 24)が加わるものと思われる。

 Intelは90nmプロセス製造への移行に際し、プロセッサ・ダイのデザインを一新した。下の写真はWillamette(180nm)、Northwood(130nm)、Prescott(90nm)の3代のPentium 4プロセッサのダイ写真だ。この3者を比べてみると、WillametteとNorthwoodのダイが、2次キャッシュの大きさを除き、かなり似通っていることに気付くだろう。ところがPrescottのダイは、レイアウトからしてかなり違っている。Prescottのダイ・デザインにおいてIntelは新しい自動化された設計ツールを用い、それによりクロック信号伝達の効率化(図1)とデータ・フローの最適化が図れたという(図2)。

大きな写真へ 大きな写真へ 大きな写真へ
Pentium 4の各世代のダイ写真
左からWillamette(180nm)、Northwood(130nm)、Prescott(90nm)。2次キャッシュが右側になるように並べた。写真では、ほぼ同じ大きさになっているが、実際の面積はWillamette > Northwood > Prescottとなっている。Prescottのダイ面積は112mm2で、Willametteの217mm2の約1/2である。
 
大きな図へ
Prescottのクロック信号伝達の効率化
2003年春のIDF Spring 2003で紹介されたPrescottの最適化の一例。プレゼンテーションの一番上に動作クロックのスケーリング向上のために(将来動作クロックを引き上げやすいように)とハッキリ書かれている。
 
大きな図へ
Prescottの浮動小数点演算ユニットの最適化
2003年春のIDF Spring 2003でPrescottの浮動小数点演算ユニットの最適化例。自動化ツールによりデータ・フロー(データの流れ)の最適化が行われたという。Northwoodの浮動小数点演算ユニット(左)が人間に理解しやすいレイアウトであるのに対し、Prescottの浮動小数点演算ユニットのレイアウトはデータ・フロー優先になっている。

 こうしたダイ・デザインの一新に合わせて、マイクロアーキテクチャの改良も行われている。図3のブロック・ダイアグラムのうち、黄緑色で示されたのが改良の加えられた部分だ。最も分かりやすい改良点はキャッシュの増量で、1次データ・キャッシュが8Kbytesから16Kbytesへ、2次キャッシュが512Kbytesから1Mbytesへと、それぞれ2倍となっている(キャッシュについては、「頭脳放談:第3回 ミスの代償−−2次キャッシュの効用」参照)。演算ユニット部分に対する改良で最も顕著なのは、SSE3と呼ばれる13個の命令追加だ。以前はPNI(Prescott New Instruction)と呼ばれていたこれらの命令は、メディアやゲーム向けのSIMD命令と、スレッドの同期命令などである。SSEからSSE2になった(Pentium IIIからPentium 4へ移行した)とき、144個もの命令が追加になったことに比べれば格段に追加数は少ない。

大きな図へ
事前説明会で示されたPrescottのブロック図
コンプレックスALU(Complex Instr.)が追加された点も見逃せない。この演算ユニットの追加が性能面でどの程度効果を示すのかは未定だ。

 性能面で注目されるのは、分岐予測ユニットの改良だ。4K個のエントリを持つBTB(Branch Target Buffer)だが、Prescottではアルゴリズムの改良が行われているという。だが、それ以上に大きな変化は分岐予測ユニットの改良に伴い、パイプラインがこれまでの20段から31段に増加したことだろう(パイプラインについては、「頭脳放談:第7回 パイプラインと動作クロックの密かな関係」参照)。一般に、パイプラインの段数を増やすとプロセッサの動作クロックを引き上げやすくなる。半面、パイプラインをフラッシュ(パイプライン内の命令やデータをすべて廃棄し、もう1度パイプラインに命令やデータを詰め直す)する際のオーバーヘッドが増える。このオーバーヘッドは性能面でのペナルティとして現れる。これがどのような影響を及ぼすのか気になるところだ。

 もう1つ忘れてはならないのは、パワーマネージメント関連の改良だ。Prescottでは、オン・ダイで実装されるサーマル・ダイオードの出力を利用してファンの回転数をプロセッサごとに制御可能にする仕組みが用意された。これを用いることで、ダイの温度に余裕がある場合は、ファンの回転数を落として、PCが出す騒音を減らすことができる。ただ、これを利用するにはBIOSとヒートシンク、ケースの対応が必要で、直ちに活用されるとは限らない。2004年春モデルとして販売されるクライアントPCでは、既存のPentium 4搭載PCをベースにプロセッサのみが置き換わる可能性が高いので、Prescottのパワーマネージメント機能は生かされないかもしれない。

 さらに気になる機能が、開発コード名「LaGrande(ラ・グランデ)」で呼ばれるハードウェアによるセキュリティ技術である(LaGrandeについては、「キーワード:次世代のセキュリティ・プラットフォームが分かるキーワード」参照)。重要な機能であるにもかかわらず、IntelのプレスリリースにはLaGrandeに関する記述がない。これは、LaGrandeを利用するには、プロセッサだけでなくチップセット、I/Oコントローラ、OSの対応が不可欠であるため、いつから利用可能になるのか、ハッキリとしないためと思われる。なお、IDFなどにおける説明では、Prescott以降のプロセッサではLaGrandeありとなしを選べるようにする、ということだったが、現時点では詳細は不明だ。

 さて、次ページでは気になるPrescottコアの性能を検証してみよう。果たして、同じ動作クロックでNorthwoodコアに比べて、どの程度性能向上を実現しているのだろうか?

  更新履歴
【2004/02/07】初出において、「Pentium 4-2.80A GHzは新製品で、2004年2月1日付の価格表(Intel Processor Pricing)にも掲載されているが、今回のプレスリリースには記載されておらず、現時点でデータシートも公表されていない。」とありましたが、データシートでは公開されておりました。この部分を修正させていただきました。お詫びして訂正させていただきます。
 
  関連記事
次世代のセキュリティ・プラットフォームが分かるキーワード
第3回 ミスの代償−−2次キャッシュの効用
第7回 パイプラインと動作クロックの密かな関係
第9回 銅配線にまつわるエトセトラ
第13回 300mmウエハは2倍お得
Hyper-ThreadingテクノロジはPCに革命を起こすか?
 
  関連リンク
Intel Processor Pricing英語
 
 

 INDEX
  [解説] 90nmプロセス製造の新Pentium 4の損得勘定
  1.Prescottの拡張ポイント
    2.Prescottは速いのか遅いのか
    3.Prescottのベンチマーク・テストの結果
 
目次ページへ  「System Insiderの解説」


System Insider フォーラム 新着記事
  • Intelと互換プロセッサとの戦いの歴史を振り返る (2017/6/28)
     Intelのx86が誕生して約40年たつという。x86プロセッサは、互換プロセッサとの戦いでもあった。その歴史を簡単に振り返ってみよう
  • 第204回 人工知能がFPGAに恋する理由 (2017/5/25)
     最近、人工知能(AI)のアクセラレータとしてFPGAを活用する動きがある。なぜCPUやGPUに加えて、FPGAが人工知能に活用されるのだろうか。その理由は?
  • IoT実用化への号砲は鳴った (2017/4/27)
     スタートの号砲が鳴ったようだ。多くのベンダーからIoTを使った実証実験の発表が相次いでいる。あと半年もすれば、実用化へのゴールも見えてくるのだろうか?
  • スパコンの新しい潮流は人工知能にあり? (2017/3/29)
     スパコン関連の発表が続いている。多くが「人工知能」をターゲットにしているようだ。人工知能向けのスパコンとはどのようなものなのか、最近の発表から見ていこう
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

System Insider 記事ランキング

本日 月間