Akiba2GO!

【最新パーツ性能チェック(Vol.29)】最後のクロックアップ!Pentium 4-570J(3.8GHz)のパフォーマンスと省電力機能を探る


2004年12月1日

 米国で15日に発表され、日本では18日から販売がはじまったPentium 4-570J。動作周波数は3.8GHzに達した。すでにCeleron Dには“J”対応モデルが登場しているが、フラッグシップのPentium 4では初めてとなる。価格的には2倍近いPentium 4 Extreme Edition-3.46GHzとの性能差、および、新コアによる消費電力削減機能の実態をレポートする。


11月29日発売のアスキープラス2005年1月号は(たぶん)世界初、「萌えるPCパーツ!!」をフィーチャー。フツーのレビューでは切り落とされてしまいがちな、特異な惹きを秘めたパーツが大集合。コストパフォーマンスだけでは測れない、自作ならではの魅力を見つめなおしましょう。このほか、お買い得液晶選び、LGA775キューブガイドと、年末のお買い物対策も万全です!


“モデル”ナンバーが上がった

Pentium 4-570J
Pentium 4-570J(3.8GHz動作)。こちらはエンジニアリングサンプルにつき、刻印は実物と異なる。裏面のキャパシタ等は下位クロックのものと同じに見えた。

 “Extreme”でないPentium 4シリーズの新しい最上位モデル、“570J”は、3.8GHzというクロック周波数の更新もさることながら、末尾の“J”が示すように、機能面でも注目すべき要素を多く備えた注目のプロセッサだ。“CPUID”の値に、今までの製品との違いが端的に表われている。
 CPUID命令ではCPUのスペックを聞き出すことができるが、最も代表的な値として、プロセッサの基本アーキテクチャを示す“ファミリー”、同アーキテクチャ内での大規模なコアの世代を示す“モデル”、各モデルにおける若干の修正を示す“ステッピング”という3つの数値がある。ファミリーの値は、PentiumIIIからPentium 4に切り替わる際に、6から15に変更された。そのうえで、モデルの値は180nmのWillametteコアから130nmのNorthwoodコアに変わる際に1から2に上がり、先日90nmのPrescottのリリースにともない3に上がった。ステッピングは、当初のC0コアでは3だったが、その後登場したD0コアでは4になった。
 今回の“J”シリーズは、より新しい“E0”コアを採用している。とはいえ、プロセスも変わっていないし、キャッシュサイズにも変更がない。コアステッピングが1つ上がっただけなら、普通なら“CPUID”でもステッピングが1つ上がるだけだ。ところが、Pentium 4-570Jではファミリーはさすがに15のままだが、モデルが4にアップされ、ステッピングは1にリセットされている。つまり、インテルにとって今回の変更は、単なる微調整ではなく、新しくコードネームを付けてもいいくらいの大きな進化を遂げていると考えていることがうかがえる。

Pentium 4-570J
Pentium 4-550
CrystalCPUID(http://crystalmark.info/)でCPUIDを表示させたところ。左がPentium 4-570J、右がPentium 4-550(赤丸は筆者による追加)。CPUの“Model”が4になっている。


 では“E0”ステップは何がそんなに違うのか。インテルは3点を挙げている。


(1)エグゼキュート・ディスエーブル・ビット


 “エグゼキュート・ディスエーブル・ビット”は、AMDなどがNX(No eXxecution)と呼んでいる、CPUによるウイルス実効防止機構のこと。
 インテルは64bit化に際してAMD64アーキテクチャを採用したのに“EM64T”などと名付けているから、今回もNXという名前をいやがっただけという気もするが、実はそうではな。NXに相当する機能は、AMD64(Opteron/Athlon64)以前にすでに、Itanium用のIA64アーキテクチャで導入されており、マニュアルには“execute disable bit”と書かれている。いわば用語としてはこっちが本家と言える。
 このビットの機能はすでに解説されているように、データ用として確保したメモリ領域でプログラムを実行しようとすると、CPU自身がこれをトラップするというものだ。多くのウイルスが用いる“バッファオーバーラン”というテクニックでは、データ用の領域にウイルスプログラムを送り込んで実行するため、それを未然に防ぐことができる。この機能を活用するにはWindows XPの場合SP2を導入する必要がある。

データ実行防止
コントロールパネル-システム→詳細設定→パフォーマンス→設定→データ実行防止のパネル。NX/XD非対応のCPUでは、下部に「お使いのコンピュータでは、ハードウェアによるDEPはサポートされません」と出る。ここに何も表示されていないのがNX/エグゼキュート・ディスエーブル・ビット対応の証となる。

(2)C1Enhanced


 “C1Enhanced”というのは、CPUのアイドル時(C1ステート)の消費電力を今まで以上に減らすための新機能だ。これは、CPUがアイドル時(HALT命令、またはMWAIT命令が発行された場合)に内部的に自動で行なわれるため、OSなどの対応は一切必要ない。
 C1ステートでは、不要不急な回路の電源を切り、多くのクロックが停止する。ただ、生きている部分のクロックと供給電圧には変更はなかった。これに対しインテルの発表によると、“C1Enhanced”対応のCPUでは、アイドル時に生きている部分のクロックと電圧を下げる。これにより、消費電力を3分の1ほどにすることができるという。

 ライバルのAMDが、Athlon 64に最初から“Cool'n'Quiet”という省電力技術を組み込み、好評を博している。90nm版ではさらにTDP(Thermal Design Power)まで下がっている。インテルとしては、消費電力を高いままにしておくのは放置できなかったに違いない。
 ただ、電圧とクロックを下げる、という点では共通していても、“Cool'n'Quiet”の動作メカニズムは“C1E”とはかなり異なる。C1Eはあくまでアイドルになったときに機能するもので、通常動作時には常にフルパワーであるのに対し、“Cool'n'Quiet”は、動作中のCPUの負荷を見て、周波数と電圧を制御するものだ。アイドル状態はまた別にある。したがってAthlon 64の場合は、フルパワー状態のアイドルモードと、ローパワー状態のアイドルモードがあり、それぞれ消費電力が異なる。フルパワー状態のアイドル時には電圧やクロックは下げていないようで、最大電流量は結構多い。この状態と比較するなら、Pentium 4のC1Eのほうが省電力の度合いは高いだろう。いっぽう、非アイドル時においては、負荷に応じてこまめに電力削減を行なうAthlon 64のほうが省電力効果は高い。
 結果的にどれくらい省電力になるか、また、そもそもPentium 4、Athlon 64がどれくらい電力を使っているかについては後ほどテスト結果をお届けする。

 なお、Athlon 64においては、ローパワーモードではクロックを1GHzまで、電圧を1.1Vまで下げることがデータシート上で明らかになっているが、Pentium 4については値は不明だ。そこでCrystal CPUIDのRealtime Clockを表示させたところ、570J(3.8GHz)の高負荷時のクロックはFSB 200MHzの19倍速(=3800MHz)と妥当なものだが、アイドル時には270MHzの14倍速で3800MHzという奇妙な表示になった。FSBが270MHzでは省電力どころかとんでもないオーバークロックなので、実際にこのようなクロックで動いているとは考えられない。実は正しいのは14倍速のほうだけ、FSBは当然ながら200MHzのままだとすると、クロックは2.8GHzということになる。
 クロックが2.8GHzで、消費電力をノーマル時の1/3にするためには、電圧を0.95Vまで落とさなければ計算が合わなくなるが、アイドル時には内部回路レベルでの省電力もあるので、2.8GHzで、電圧はもう少し高くても、1/3にできる可能性は十分あるだろう。

Crystal CPUID
Pentium 4-570Jがアイドル時のCrystal CPUIDのRealtime Clockの表示。なぜかFSBが271MHzとなっているが、これはあり得ない。単に正しい値が取得できないだけなのかもしれないが、倍率だけは正しいと仮定すると、実周波数は2800MHzと推定できる。

(3)Thermal Monitor 2


 最後の“Thermal Monitor 2”というのは、従来からあった“Thermal Monitor”の強化版だ。“Thermal Monitor”は、CPUが危険なほど高温になった際に、クロックを1/3ほどに落とすことでCPUの冷却を計る保護機構だ。これでCPUが熱で破壊されるのは免れるが、ユーザーにとってはクロックをそこまで落とされては使い勝手が悪くなる。“Thermal Monitor 2”は、高温時の対応として電圧も下げるようにすることで、代わりにクロックをあまり減らさずに、同程度の冷却効果を得ようとするものだ。“Thermal Monitor”とどちらを使うかはシステムの設計による。
 発熱量はクロックと電圧の自乗に比例するから、たとえば電圧を1.4Vから1Vに下げれば、クロックを3.8GHzから2.5GHzに落とすだけで発熱量は1/3にできる。クロックだけで1/3にしようとすると、1.3GHzまで落とす必要があるが、これよりずいぶんパフォーマンスを維持できるわけだ。
 もっとも、“Thermal Monitor 2”はそもそも積極的に活用するものではなく、“Thermal Monitor”が発動したりしないようにきちんと冷却することのほうが先決だろう。

 なお、従来LGA775のCPUは、Pentium 4-550(3.4GHz)以上はすべてTDPが115Wとなっていた。ただ、クロックが違うのにTDPが同じというのはおかしい。インテルはLGA775のプラットフォームを、メインストリームのAタイプ(84Wまで)と、パフォーマンス向けのBタイプ(115Wまで)の2種類に分けていて、データシートに表示されるTDPは、実際のCPUの最大発熱量ではなく、AとBのどちらに属するかを表わしていると考えるべきだろう。その意味では、Pentium 4-550は115W食うわけではなく、84Wと115Wの間の「下の方」ではあったと思われるが、いずれにしろ84Wは超えていた。
 だが、“E0”コアのPentium 4-550は、ほとんどの製品が84W以内に変更されている(Processor Spec Finderでは、初期のものと思われる1製品だけ115W)。“D0”コアの製品はすべて115Wなので、“E0”コアではノーマル時の消費電力の削減もはかられていると見られる。



570Jと3.46GHzはどっちが速い!?

 では、注目のパフォーマンスを検証していくことにしよう。Pentium 4-570Jの対抗馬としては、ライバルのAthlon 64シリーズのほか、自社のPentium 4 Extreme Editionがある。前回(Vol.28)は、現在一般的なスペックのDDR2 DIMM(Active to Prechargeが12、CASレイテンシ、RAStoCAS、プリチャージがそれぞれ4。いわゆる“12-4-4-4”)で計測したが、今回はCorsair Memory製の“XMS2 DDR2 PRO”シリーズのPC2-4300/512MBモジュール「CM2X512-4300C3PRO」を用いた。これは上記タイミングが8-3-3-3となっている。DDR400は通常8-3-3-3なので、これを使えば、400→533MHzというメモリークロック向上分による性能向上をフルに引き出すことができる。Pentium 4 Extreme Edition-3.46GHzにとってメリットがあるだけでなく、レイテンシが短縮されることはPentium 4-570JのようなFSB800MHzのシステムにおいても効果はあるだろう。

「CM2X512-4300C3PRO」
“XMS2 DDR2 PRO”シリーズのPC2-4300メモリ「CM2X512-4300C3PRO」。アクセスに応じて上面にあるLEDが光る。
SPD
“XMS2 DDR2 PRO”シリーズメモリのSPD値を確認したところ。8-3-3-3になっている。


 さて、最初にレイテンシ削減によるメモリ性能の違いから。CorsairのPC2-4300メモリを、SPDに書かれた8-3-3-3の標準設定のほか、BIOS上でタイミングを12-4-4-4に設定した場合とを比較してみた。このほか、この高速メモリをPentium 4-570Jでドライブした場合、さらに、DDR400(8-3-3-3)をAthlon 64でドライブした場合とを並べてみた。なおチップセットはPentium 4についてはインテル製925XEマザー「D925XECV2」、Athlon 64はMSI製K8T800 Pro「K8T Neo2」を用いた。すべてデュアルチャンネルである。
 Pentium 4-570Jがひときわ落ち込んでいるのが目に付くが、FSB800MHzのPentium 4では毎秒4.8GB程度が普通なので、ほぼ5GBまで迫ったのはむしろ快挙と言える。800MHzのFSBでは理論上限性能は毎秒6.4GB。メモリとCPUの間にチップセットを挟んでいるオーバーヘッドを考えると、実効性能としてはこのあたりが限界ということだ。これに対してFSB1066MHz、理論上限8.5GBのP4-3.46GHzはすばらしい。しかも、12-4-4-4設定に比べ、8-3-3-3設定にすると毎秒200MBの性能向上を果たし、毎秒5.79GBという高性能をマークした。これはメモリコントローラをCPUに内蔵したAthlon 64シリーズにあと200MBまで迫るものだ。

Sandra 2004SP2 Memory
Sandra 2004SP2 Memory(FPU)の結果。棒が長い方が高速。

 この効果だろう、各種ベンチマークの結果も、ものによってはほとんど差が見えない場合もあるが、全体的に8-3-3-3設定のほうが高速になっている。“i925XE”+“Pentium 4 Extreme Edition”というようなシステムを組むのであれば、メモリのスペックにも気を配る価値がある。

 さて、問題のPentium 4-570Jとの対決だが、3Dゲーム系では3DMark 03のメインスコアを除き、333MHzのクロックのビハインドをものともせず、依然Pentium 4 Extreme Edition-3.46GHz@1066FSBがトップを走っている。ただ、Commanche 4を除けば差は大きくはない。前回(Vol.28)のPentium 4-550(3.4EGHz)との比較では、3D系では結構目に見える差が出ていたが、Pentium 4-570Jではその差がかなり縮んでしまったことがわかる。

3DMark 2001SEの結果。棒が長い方が高速。
Commanche 4の結果。棒が長い方が高速。
3DMark 03の結果。棒が長い方が高速。
Final Fantasy XI ver.2の結果。棒が長い方が高速。
Unreal Tournament 2003の結果。棒が長い方が高速。

 いっぽう、PCMarkやエンコード、圧縮、数値演算といった各種テストでは、CineBenchのレンダリングを唯一の例外として、残りはPentium 4-570Jの圧勝となっている。これらのテストはPentium 4-550との対決でもPentium 4-550優位であり、相手がPentium 4-570Jともなれば差は決定的になる。これらの結果を総合的に判断すると、Pentium 4-570Jの1.5倍、金額にして4万5000円アップというPentium 4 Extreme Edition-3.46GHzの価格を納得させるのは難しいだろう。
 3D以外のテストでPentium 4 Extreme Edition-3.46GHzが弱いのは、クロックが低いことに加え、コアがNorthwoodベースなのでSSE3が使えないこと、比較的高速な2次キャッシュの容量がPentium 4-570Jの半分しかないことが影響している。Pentium 4 Extreme Editionが輝きを取り戻すには、早急な90nmプロセス化による高クロック化、Prescottコア化が必要だろう。
 なお、3Dカードの性能がベンチマークに影響しないと考えられるエンコード、圧縮系のテストについては、Athlon 64-4000+およびAthlon 64-FX55の結果も併記している。動画エンコード2種は、テストがSSE3やHyper-Threadingに対応していることもあってPentium 4陣営が優勢、エンコードや数値演算(ここではSuperπ)はAthlon 64が優勢というのは以前からの傾向だ。

PCMark 04の結果。棒が長い方が高速。
CineBench 2003の結果。棒が長い方が高速。
TMPGEnc 3でのMPEG2ファイル作成時間。単位は秒。棒は短い方が高速。
Windows Media Encoder9でのWMVファイル作成時間。単位は秒。棒は短い方が高速。
DGCAβ9でのファイル圧縮時間。単位は秒。棒は短い方が高速。
Superπでのπの104万桁の計算時間。単位は秒。棒は短い方が高速。


C1Eの省電力機能の効果は?

 Pentium 4-570Jは、3DではPentium 4 Extreme Edition-3.46GHzにあと一歩まで迫り、従来から非常に高速だった動画エンコード系ではさらに差を広げた。パフォーマンス面では予想どおりだ。それよりも注目したいのは、“E0”コアの新機能、C1Eによるアイドル時の消費電力削減効果のほうだ。
 そこで今回は、エンジニアリングサンプルのPentium 4-570J(“E0”コア、3.8GHz動作)、同じくESの550(“D0”コア、3.4GHz動作)、および、Pentium 4-570Jの倍率を17倍にセットして最高3.4GHz動作にしたもの(これはES品のみ可能で、製品版のPentium 4-570Jでは不可能)とで、アイドル時、および高負荷時の消費電力を測定してみた。最高動作周波数を揃えることで、“D0”と“E0”の消費電力の違いをできるだけ精密に測定しようという試みである。
 なお、CPU単体の電力は測定困難なので、以下に示す値はシステム全体(1GB DDR2メモリ、80GB HDD、RADEON X700Proビデオカード、CPUファン)の消費電力である。また、比較用にNewcastleコア(130nm)のAthlon 64-3500+システム(周辺機器は同じ、メモリのみDDR400)の消費電力も計測してみた。

消費電力の比較
システム全体の消費電力の比較(棒が短い方が低消費電力)。

 注目のアイドル時消費電力は、Pentium 4-550の115Wに対し、Pentium 4-570Jは108Wと、CPU自身のクロックは高いにもかかわらずPentium 4-570Jのほうが小さくなっている。また、上限クロックを3.4GHzに設定した場合でもアイドル時の電力は変わらない。このCPUに設定された、アイドル時用のある一定の周波数に引き下げられていることがわかる。

 115Wと108Wでは大した差ではないようにも見えるが、決してそうではない。
 まず、すでに述べたように、グラフの数値はシステム全体の消費電力で、CPU単体のものではない。今回使った“i925XE”マザー「D925XECV2」はCPUを抜いた状態では電源が入らないためCPU以外のシステムの電力参考値を得ることができなかったが、比較用のAthlon 64マザーでは、CPUを抜いた状態での消費電力は62Wだった。“i925XE”マザーでもだいたい同じくらいだとすると、CPU単体の電力消費はアイドル時にPentium 4-570Jが46W、Pentium 4-550は53Wということになり、消費電力は13%減ったことになる。

 さらに考慮すべき問題としては、今回の比較が“3.8GHz動作を保証されている”Pentium 4-570Jと、“3.4GHzが最高保証周波数である”Pentium 4-550との間でなされていることだ。一般に、高速動作が可能なトランジスタはスレッショルド電圧(Vt)が低く、Vtが低いトランジスタはリーク電流が多い。要するに、Pentium 4-570Jは3.8GHz動作を確実にするために、リーク電流がそれにともなって増えるのに目をつぶらなければならないという事情がある。いっぽうPentium 4-550は3.4GHzで動ければいいので、Vtはもう少し高くてもよく、その分、リーク電流は抑えられる。したがって、C1Eの効果を純粋に計測するためには、同じVt特性を持ったシリコンで、C1E装備、非装備のものを比べなくてはならない。まったく同じというのは無理でも、せめてPentium 4-570JとPentium 4-570、あるいはPentium 4-550JとPentium 4-550とで比べなければならない。
 残念ながらPentium 4-570は登場しないようであるし、Pentium 4-550Jも現状では入手できないため、今回はPentium 4-570JとPentium 4-550で比較したわけだが、仮に“J”でないPentium 4-570があれば、アイドル時システム電力は115Wではすまないし、仮にPentium 4-550Jがあればアイドル時電力は108Wより下になると考えられる。要するに、C1Eの効果は7Wよりは大きいはずなのである。

 Superπ(ほぼCPUのみに高負荷)、Unreal Tournament(ビデオカードにも高負荷)の最高消費電力はさすがにPentium 4-570Jが一番高い。それはまあいいのだが、Pentium 4-570Jを3.4GHz設定にした“仮想Pentium 4-550J”は、“D0”ステップのPentium 4-550よりも高負荷時の消費電力が高くなっているのは奇妙だ。“E0”ステップによってPentium 4-550JはTDPを115Wから84Wに下げた、という話と矛盾するからだ。
 この原因もおそらく、仮想Pentium 4-550JのシリコンがPentium 4-570Jであるため、リーク電流が多いためと考えられる。3.4GHzまでしか動けない「本物のPentium 4-550J」であれば、Vtはもっと高くてすむのでリーク電流は減るからだ。
 なお、Athlon 64-3500+との比較では、Pentium 4-570J@3.4GHzを用いた場合で、アイドル時、高負荷時ともにシステムレベルで35%も高い。3.8GHz動作のシリコンを使っていることによるリーク電流増加分を差し引くにしても、挽回できる差ではないだろう。しかも、データシートによれば、最近出回ってきた90nm SOIのAthlon 64コア“Winchester”では、TDPがさらに20Wほども低くなっている。“クールさ”の競争では、C1E登場後も、依然Athlon 64のリードが続きそうだ。



“クロックより機能”の時代の幕開け

 インテルは当初、2004年中に4GHz版を投入する予定だったが、今年10月、これをキャンセルした。また、次の性能向上アイデアはデュアルコアであることが明らかになっているが、現行のコアとプロセスを使うとすれば消費電力が増えてしまうため、クロックはむしろ下げざるを得ない。Pentium 4-570Jは65nsプロセスが実用化する2005年末から2006年まで、あと1年かそれ以上は、パソコン用CPUとして最高のクロックをほぼ約束された存在ということになる。すさまじい周波数のパワーで他を圧倒するという、Pentium 4スタイルのひとつの究極の姿とも言える。
 ただ、3.8GHzの登場を首を長くして待っていたという人は、正直な話そんなに多くはないのではないだろうか。それよりユーザーにとっての目下の懸案は、深刻化するウイルスであり、CPUの消費電力増に伴う電気代の増加であり、大容量データを扱う上でのネックとなる32ビットメモリ空間の狭さだ。9月のIDFで、インテルは「プロセッサは性能の向上とともに、プロセッサの機能や外部環境の強化が求められている。インテルは今までMMXやSSE、HTとさまざまな機能を追加してきたし、今後も追加していく」という趣旨のプレゼンテーションを行なった。

IDF
9月のIDFにおけるオッテリーニ社長のキーノートでのスライド。GHz(=パフォーマンス)にはすでにチェックマークがついていて、近年ユーザーの利便性を強化しているのはプロセッサやチップセットの機能追加であることが示されている。

  その指摘は的を得ているが、上に挙げた、今求められている3つの機能を先に実装したのはAMDだった。すでに1年以上前の2003年9月、Athlon 64のデビューとともに“NXビット”、“Cool'n'Quiet”、“AMD64”に対応している。それに対し、Pentium 4はこのどれもないまま2004年の年末を迎えようとしていた。

 今回の“E0”コアの「Jシリーズ」は、64ビット対応こそ見送られたものの、現時点で大多数のユーザーに十分なメリットを提供するウイルス防止機能と省電力機能がついに搭載されたわけだが、そのことが一目でわかる“J”というサフィックスを付けた点に大いに注目したい。というのも、Pentium 4のクロックはもう十分な水準に達していると考えている人は、今後「Jがついているかどうか」を製品選びの一大チェックポイントとして認識するようになるからだ。

 こうしてクロック以外の面がきちんと注目され、それについての評価が高まり、販売数増加につながれば、それはプロセッサメーカーの機能拡充へのインセンティブを高め、結果的にはユーザーにさらなる利益をもたらす。“J”の登場は、CPUの機能競争時代をアナウンスするゴングなのかもしれない。

※今回のテストで使用したPentium 4-570Jはエンジニアリングサンプル版であり、市販されている製品ではありません。

※1ページ目下部のスクリーンショットにおいて、『CPUZ(http://www.cpuid.com/)でCPUIDを表示させたところ。』とありますが、これは誤りで、正しくは『CrystalCPUID(http://crystalmark.info/)でCPUIDを表示させたところ。』でした。作者のhiyohiyo様はじめ、関係各位、読者の皆様にご迷惑をおかけしましたことをお詫びして訂正いたします。
 また、この画面ではSpeedStepが有効と表示されていますが、11月以降のバージョンでは修正され、無効と表示されます。古いバージョンを使用したために、CPUの素性について誤った情報をお伝えしてしまったことをお詫びいたします。また、続く『C1Eにおけるクロック・電圧低下のためにSpeedStepの機構が必要なのだろう。』という部分は、この誤った判断に基づく推測ですので、削除しました。

【関連記事】

(アスキープラス編集部 野口岳郎)




[通常ページに戻る]
ASCII24 http://ascii24.com/
Copyright (C)2000-2008 ASCII Corporation. All rights reserved.