Akiba2GO!

【最新パーツ性能チェック(Vol.34)】CPUの勢力図は変わるか? デュアルコアCPU4種対決!――Pentium D vs. Pentium XE vs. Athlon 64 X2 vs. デュアルコアOpteron 2xx


2005年6月1日

 27日にインテルが「Pentium D」のラインナップと価格を正式発表し、これで2005年に登場予定の4つのデュアルコアCPU4種類、「Pentium D」「Pentium XE」「デュアルコアOpteron 2xx」「Athlon 64 X2」が勢揃いした。そこで、これらのデュアルコアCPU群と、従来のシングルコアCPUとをまとめて性能を比較してみた。

4つのCPUの素顔

 Pentium XEについては前回お届けしたとおり。PrescottコアのPentium 4を2つほぼまるごと取り込んだような存在だ。各コアがそれぞれHyper-Threadingをサポートするため、パッケージ上は1CPUだがOSからは4CPUに見える。プロセッサナンバは840のみで、周波数は3.2GHz。“XD(NX)ビット”、“EM64T”をサポートする。

Pentium XE 840
Pentium XE 840のCPU情報。1CPUなのにOSからは4CPUに見える。うち2つはHTによって作られた“論理CPU”であることがわかる

 いっぽう5月27日に発表されたPentium Dは、840、830、820の3モデル構成で、周波数は順に3.2、3.0、2.8GHz。Prescottコアを2つ取り込んでいるのはPentium XEと同じだが、Hyper Threadingがサポートされないため、見かけは2CPUとなる。“XD(NX)ビット”、“EM64T”のほか、“EIST(スピードステップ)”にも対応する。

Pentium D
Pentium DのCPU情報。こちらは論理CPUはナシで2CPUが見えている。CPUIDはPentium XEと同じ“F44”

 対するAMD陣営は、Athlon 64のデュアルコア版「Athlon 64 X2」に4200+、4400+、4600+、4800+の4モデルを用意。4200+と4400+は2.2GHz、4600+と4800+は2.4GHzで、4400+と4800+が2次キャッシュを1MB装備、4200+と4600+は512KB装備となっている。コアそのものはSSE3対応の“Venice”相当だ。

Athlon 64 X2 4800+
Athlon 64 X2 4800+のCPU情報。クロックは現行Athlon 64シリーズ最高の4000+と同じ2.4GHzをキープ。AMDの資料によれば電圧は1.35Vのはずだが、CPUZによる表示では1.3Vになっている

 さらに、サーバ・ワークステーション向けでマルチプロセッサ構成が可能なOpteronにデュアルコア版が追加された。モデルナンバーはデュアルCPUまで対応の200シリーズが265、270、275の3モデル、8CPUまでが可能な800シリーズが865、870、875の3モデル。周波数は順に1.8、2.0、2.2GHz、2次キャッシュは全製品ともに1MBとなっている。

Opteron 875
デュアルコアのOpteron 875のCPU情報。この写真はデュアルCPUマザーにデュアルコアOpteronを2つ乗せた場合のもの。本物のCPUが4つ見えている。こちらは公表数値どおり、電圧は1.35Vになっている。

 以上をまとめると表のようになる。

インテルCPUクロック&型番チャート
デュアルコア シングルコア
Pentium XE Pentium D Pentium 4 XE Pentium 4-600 Pentium 4-500
3.8GHz 670 570
3.73GHz 3.73GHz
3.6GHz 660 560
3.46GHz 3.46GHz
3.4GHz 3.4GHz 650 550
3.2GHz 840 840 640 540
3GHz 830 630 530
2.8GHz 820 520
AMD製CPUクロック&型番チャート
動作周波数/L2キャッシュ デュアルコア シングルコア
Athlon 64 X2 DC Opteron Athlon 64FX Athlon 64(939) Opteron
2.6GHz/1M 55 252
2.4GHz/1M 4800+ 53 4000+ 250
2.4GHz/512K 4600+ 3800+
2.2GHz/1M 4400+ 275 51 3700+ 248
2.2GHz/512K 4200+ 3500+
2GHz/1M 270 246
2GHz/512K 3200+
1.8GHz/1M 265 244
1.8GHz/512K 3000+
       ※AMD製のデュアルコアCPUのL2キャッシュは1つのコアあたりの搭載量になります。

なぜインテルはクロックが下がりAMDは下がらないのか

 インテル製品について言えば、デュアルコア製品はシングルコア製品に比べ、クロック周波数で最大600MHz下がっていることがわかる。ちなみにTDPは、シングルコア製品では最大115Wだったが、デュアルコアでは130Wに上がっている。内部トランジスタのスピード的には3.8GHzまで動かせる実績があるのに、デュアルコアPentiumのクロックが3.2GHzに押さえられているのは、発熱が大きすぎるという点にあると考えられる。

 CPUをほぼ丸ごと2つ内蔵しているのであれば、TDPは2倍になってもおかしくない。3.8GHz品はシングルコアの状態でTDPは115W近いと考えられ、これだとデュアルでは230W。これを130Wに収めるのはさすがに無理そうだ。
 というより、(実製品が存在する)3.2GHzでも微妙なところだ。PrescottコアはEステップだと3.4GHz品のTDPが84Wを切っているので、3.2GHz品は単純計算で79W以下にはなるが、それでも2倍すると158W。これではPentium D/XE 840(3.2GHz)の130WというTDPには収まらない。実際には、スペックを見るとPentium D/XEのトランジスタ数は、Prescottの84%増しにしかなっておらず、ダイサイズの増加もだいたいそれくらいだ。「Prescottコアが2つ入っている」という説明とは合わないが、機能に影響が出ない範囲でなにかしらの削減が行なわれているのだろう。このトランジスタ減が消費電力減に直結するなら133Wとなりだいたい計算が合うが、“実際に熱を出す=使われている部分”はそうは削減できないはずだから、回路の低消費電力化など別の工夫があると考えたほうがいいかもしれない。
 いずれにしても、3.2GHzでも、158Wを130Wにするという結構な苦労がある。これではトップスピードの3.8GHzはおろか、1ランク上の3.4GHzのデュアルコアでも、130W以内にするには相当な困難が伴うことは容易に想像がつく。

 一方AMDであるが、サーバ用のOpteronについては、デュアルコア製品では最高クロックが400MHz落ちている。率にするとインテルとほぼ同じ18%のダウンとなる。しかし、デスクトップ用のAthlon 64 X2に関して言えば、現行最上位の4000+と同じ2.4GHzをキープしている。
 従来OpteronはAthlon 64に比べるとクロック向上はワンテンポ遅かった。サーバ向けということで、テストがよりシビアなのかもしれないし、CPU間通信に伴うHyperTransportリンク部分の発熱量が意外に大きいのかもしれない。

 こんな中、Athlon 64 X2はクロックを下げずにすんだ。最大の理由としては、もともとAthlon 64の消費電力がそう大きくない点が挙げられる。WinchesterコアのAthlon 64 3500+(2.2GHz動作)は、1.4V動作でTDPが67Wしかない。Athlon 64 X2は1.35V動作なので、いっそう有利だ。さらに、Athlon 64 X2においては、CPUコアをまるまる2つにしたわけではない。Athlon 64は当初の設計から、純粋なコア部分(プログラムの実行を行なう部分)をもう1つ足せるように作られており、それ以外の部分、たとえば、メモリコントローラ、Hyper Transportなどのバスインターフェイス、それにコアとこれらとのデータの流れを調停するクロスバーなどは、増やす必要がない。(AMDはこれを以て「真のデュアルコア」と称している)。

 実際、ダイサイズで見ると、シングルのVeniceコアの84mm2に対し、同じキャッシュ512KBのデュアルコアAthlon 64 X2 4200+/4600+は147mm2で、サイズは75%しか増えていない。
 以上を勘案して、2.4GHz/キャッシュ512KBのAthlon 64 X2 4600+の予想消費電力を計算すると、67×1.75×(1.35/1.4)2×(2.4/2.2)=118Wとなる。公表TDP値である110Wを少し超えてしまうが、118Wを100Wにするくらいは、158を130にするのに比べればはるかに敷居は低い。4800+ではキャッシュが増えるため消費電力はさらに増えるが、一説には、現在の90nmコアである「E」ステップはWinchesterに比べ低消費電力とも言われており、だとすれば納得できる範囲だ。また、編集部が借用したAthlon 64 X2 4800+のサンプルは電圧が1.3Vと表示されており、この値が事実だとすれば、110Wに収めるのはいっそう容易になる。



豪華10環境でガチンコ対決!

 さて、いよいよシングル、デュアルコア入り交じっての大ベンチマーク大会に入る。今回エントリーしたのは以下の製品だ。

・Pentium 4 670
(Pentium Dと同時に発表された、キャッシュ2MB搭載のPentium 4。シングルコアの最高峰の一角)
・Pentium 4 XE 3.73GHz
(FSB1066の、インテルのシングルコアのフラッグシップ)
・Pentium XE 840
(論理4プロセッサの、インテルのデュアルコア製品の最高峰)
・Pentium D 820
(お手軽デュアルコア)
・Athlon 64 4000+
(シングルコアAthlon 64の最高峰)
・Athlon 64 X2 4400+相当
(Opteron 875を単体で計測)
・Atholn 64 X2 4800+
(ソケット939の新たな最高峰か)
・Opteron 250×2
(周波数、キャッシュ容量、コア数ではAthlon 64 4800+とほぼ同等だが、こちらは2つのCPUがマザーボード上で接続されるため、オンチップで接続される4800+よりは不利になる。これによる性能差がどれくらいになるかを見るために計測した)

 計測環境は以下の通り。ビデオカードはATI「RADEON X700 Pro」(256MB)、HDDはSeagate「Barracuda ATA V」(80GB)、メモリ容量はすべて1GBである。

・Pentium 4 670、Pentium D 820
インテル「D945GTP」(インテル 945G)、PC2-4300
・Pentium 4 XE
インテル「D925XECV2」(インテル 925XE)、PC2-4300
・Pentium XE 840、Pentium D 840相当
インテル「D955XBK」(インテル 955X)、PC-5300
・Athlon 64 4000+
ATIリファレンス(ATI Xpress 200)、PC3200
・Athlon X2 4800+
ASUS「A8N SLI」(nForce4 SLI)、PC3200
・Athlon X2 4400+相当、Opteron 252×2、Opteron 875×2
リオワークス「HDAM Express」(nForce4 Professional 200)、レジスタードPC3200

 さて、デュアルコアのベンチ結果を見ていく上で、大前提が一つある。デュアルコアCPUとは、処理を2つのCPUが勝手に分担処理してくれるというもの“ではない”。2つのコアが生きるのは、あらかじめプログラムが、複数のCPUコアの存在を想定して処理を分割している(マルチスレッド化されている)場合、または、複数のプログラムが同時に走る場合に限られる。1つの処理ストリームが実行を続けるアプリ(シングルスレッドのアプリ)では、コアの数が増えてもあるタイミングで使われるコアは常に1つだけなので性能は上がらない。

 今回はエントリー機種が多く、グラフの棒が入り乱れているため、最初に“予想されるできごと”と“今回のみどころ”をクリアにしておこう。

 前回のPentium XEのテストで明らかになったのは、

・3Dゲーム系などのシングルスレッドのテストは、デュアル化しても性能が上がらなかった。Pentium XEはクロックがハイエンドのシングルコア製品に比べ低いので、結果として性能的には振るわない
・エンコードやCGレンダリングなどの分野に見られる、マルチスレッド化されたアプリにおいては、デュアルコアによって大きく性能向上があり、シングルコアにすれば5GHz以上に相当するスコアが得られる場合もある

 という点だ。これをふまえ、今回チェックしたいのは、

・Pentium Dは、HTがOFFになり、クロック的にもPentium XEと同じかそれ以下なので、3Dゲームなどシングルスレッド系の高性能は期待できない。エンコードなどにおいて、ハイエンドのシングルコアPentium 4を上回ることができるか、その度合いがどれくらいになるか。
・Athlon 64 X2は、クロックが下がらなかったので、シングルスレッド系でも既存のシングルコア製品と同等の性能が期待できるが、実際にそれだけの性能が出るか。また、従来HTがないためにPentium 4に大きく差を付けられていたエンコードやマルチタスク系テストでどこまでスコアを伸ばせるか。デュアルコアPentium 4との性能の上下関係はどうなるか。

 という点である。



Athlon 64 X2はシングルスレッドでも性能低下なし

 以下、グラフ中ではわかりやすくするため、デュアルコアのCPUには●を、また、4コアとなる「デュアルコアOpteron×2」については★を付した。

 「Superπ」(グラフ1)を見ると、シングルスレッドのアプリは、デュアルコアになってもまったく性能が上がらないことがよくわかる。結果、インテルのデュアルコア製品は、いずれも現行のハイエンドシングルコア製品に比べると、コアのクロックが低い分、性能が落ちてしまう。Athlon 64 X2は、同性能をキープできていることがわかる。

Superπ
グラフ1・「Superπ」の結果(単位は秒、棒が短いほど高速)
3DMark 2001
グラフ2・「3DMark 2001」の結果
3DMark 03
グラフ3・「3DMark 03」の結果
Final Fantasy XI ver.2
グラフ4・「Final Fantasy XI ver.2」の結果
Unreal Tournament 2003
グラフ5・「Unreal Tournament 2003」の結果

エンコードやレンダリングはデュアルコアの天下

 グラフ6と7は、CGのレンダリングと動画のエンコードのテスト結果だ。こちらではデュアルコア勢が水を得たようにスコアを伸ばすのがわかる。一番直接的なのは、1枚の絵を複数のCPUがよってたかってレンダリングする「Cinebench 2003」だ(グラフ6)。これはデュアルコア化することによって倍近くも性能が伸びる。
 Pentium XE 840は、HTによる4スレッド同時実行が効き、Pentium 4 670との600MHzのクロック差をものともせず、1.5倍ものスコアを記録した。HTをオフにした、Pentium D 840相当時でも35%のリード、それどころか、クロックでは1GHzも低いPentium D 820でさえ、Pentium 4 670より15%早い。

Cinebench 2003
グラフ6・「Cinebench 2003」(レンダリング)の結果
TMPGEnc 3
グラフ7・「TMPGEnc 3」でのMPEG-2生成テストの結果(単位は秒、棒が短いほど高速)

 しかしながら、最も劇的な変化はAthlon 64に訪れた。Athlon 64はHyper Threading機能を持たないため、従来HT搭載のPentium 4勢に、この種のマルチスレッド系ベンチマークで辛酸を嘗めてきた。Cinebenchでも、4000+がPentium 4 670には20%ほどのリードを許していた。
 だが、実質上4000+のデュアルコア版といえるX2 4800+は、スコアを9割増しの641にまで伸ばした。これはシングルコアのPentium 4勢はおろか、インテルデュアルコアの最上位、Pentium XE 840さえ上回る好結果だ。

 デュアルコアOpteronを2つ用いた場合には、スコアはついに1000を突破する。インテルプラットフォームでは、2次キャッシュ2MBのIrwindaleコアのXeon 3.6GHzを2つ使えばPentium XE 840を若干は上回る(クロックが12.5%高く、キャッシュが2倍)スコアにはなるが、1.6倍の差はさすがにひっくり返るまい。業務でCGレンダリングを行なう方には、デュアルCPU構成を取れるデュアルコアOpteronは魅力的なものになりそうだ。

 TMPGEncによるMPEG-2ファイルの作成では、Pentium XEが面目を保った(グラフ7)。とはいえ、Atholn 64 X2 4800+はそれに次ぐ2位で、Pentium D 840相当を上回っている。まっ先にSSE3に対応するなど、Pentium 4との親和性が高いTMPGEncによる性能比較は、従来Athlon 64にとっては一番痛いところだった(実際今回のエントリーでは、Athlon 64 4000+の性能は突出した低さになっている)が、X2の登場でその弱点も克服されたといえる。お金を投じてデュアルコアOpteron×2にすれば、XEを上回る性能さえ実現可能になった。Xeon 3.6GHzデュアルでも、XEに対し30%性能アップするとは期待しにくく、デュアルコアOpteron×2のトップは揺るがないだろう。マルチスレッド対応のアプリでは、コア4つという構成が取れるデュアルコアOpteronの強さは圧倒的だ。

 また、Opteron 250×2とAthlon 64 X2 4800+の結果を見比べると、どのテストでも4800+のほうが若干性能が高くなっている。nForce4ファミリーとはいえ、厳密には同じチップセットではないこと、マザーボードメーカーも異なること、Opteronではレイテンシで不利になるレジスタードDDRメモリを使っているなど、まったく同条件ではないとはいえ、差は誤差範囲よりは明らかに大きい。AMDが主張するように、2つのコアの間の通信が、ボード上の信号線ではなく、チップ内でコアスピードで完結していることが効いていると見るほうが自然だろう。いわばこれが「真のデュアルコア」であるメリットということになる。



デュアルとマルチの間の深淵

 一見奇妙な結果となったのは、グラフ8の「Windows Media Encoder」によるWMVファイルの作成だ。WMVは典型的な“HTがよく効く”=“マルチスレッド化された”アプリだ。当然4スレッド実行のPentium XEに期待がかかる。
 ところが、予想に反してPentium XEのスコアは伸びず、Pentium 4 670をかろうじてかわした程度。ところが、同じデュアルコアでもHyper ThreadingがないPentium Dは大きく性能アップし、Pentium D 820がXEを出し抜き、Pentium D 840相当(実際はXEのHTをオフにした状態)ではリードは大きく広がる。

 Athlon 64もデュアルコア化することで性能が2倍近くに伸び、X2 4800+は、Pentium XEはもちろん、Pentium D 840相当に対しても12%のリードと、一気にグループ最後尾からトップに躍り出た格好だ。

Windows Media Encoder 9
グラフ8・「Windows Media Encoder 9」でのWMV生成テストの結果(単位は秒、棒が短いほど高速)
PCMark 04
グラフ9・「PCMark 04」の結果

 Pentium DやAthlon 64 X2の性能を見る限り、WMEがマルチスレッド化されていて、それによって性能が上がることは間違いない。では、さらに強化した4スレッド同時実行のPentium XEで性能が、2スレッドのPentium Dより低いのはなぜだろうか?

 鍵は、同じく4スレッド実行可能環境であるデュアルコアOpteron×2の性能を見ると見当がつく。こちらも、デュアルコアCPU 1つの場合に比べ、性能がほとんど伸びていない。3つ以上のスレッドが動いていれば、デュアルコアに比べて高速になるはずである。このことから、どうやらWMEは「マルチスレッド」アプリではなく「デュアルスレッド」アプリであることがわかる。

 それにしても、Opteronのように性能が「上がらない」のはまだわかるが、「下がる」のはなぜか。これはおそらく、WMEの2つのスレッドが、場合によっては1つのコアに割り当てられてしまうためと思われる。Pentium XEは、2つのコアがそれぞれHTをサポートしている。仮にOSから見た場合に、コアAがCPU1/2、コアBがCPU3/4に見えるとしよう。
 Windows XPでは、WMEが作る2つのスレッドを、4つのCPUのうちのどれか2つに割り当てようとするので、運が悪いと、CPU1とCPU2、あるいはCPU3とCPU4に、2つのスレッドが割り当てられてしまう。この状態では、実際に作業を行なうのはコア1つだけになってしまい、性能低下につながるのではないかと想像される。これに対してデュアルコアOpteron×2の環境では、CPU1/2/3/4はどれもそれぞれ本物のコアなので、どの2つに割り当てられても性能が落ちることがない、というわけだ。

 同様の“事件”が、「PCMark 04」でも起きている。このテストには“マルチタスクテスト”がかなり含まれているが、それらは実際には“ウイルスチェックしながら(ワープロの)文法チェック”“ファイルを解凍しながら画像を加工”といった内容で、マルチタスクというより“デュアルタスク”だ。そのため、WMEと同じ問題が起き、Pentium XEはPentium D 840相当より性能が低く、Pentium D 820に詰め寄られる結果になっている。

 テストに用いたPentium XEとマザーボードはサンプル品であるため、CPUあるいはBIOSなどに問題があった可能性はある。また、OSやアプリが「本当のCPU」と「HTによって作られた論理CPU」とを区別し、重いスレッドが本物のCPUを優先して使うようになれば、将来的には回避可能かもしれないが、HTがこのような性能低下を招きうるということは記憶にとどめておいたほうがいいかもしれない。



Athlon 64 X2の性能は文句なし、Pentium Dはエンコード目的にコストパフォーマンス高し

 スコア的に今回一番の注目点は、エンコードなどマルチスレッド系アプリにおけるAthlon 64 X2の劇的なスコア向上だ。従来はPentium 4系に大きく水を空けられていたのに、今回はシングルコアのPentium 4はもちろん、デュアルコアのPentium XE/Dさえ上回るスコアを連発した。Pentiumの牙城は「TMPGEnc」が残るだけとなった。しかも、シングルスレッド系では従来からの強みを失っておらず、結果、ゲームもエンコードも速い、理想的なパフォーマンスバランスを実現した。BIOSさえアップデートすれば、原則、既存のソケット939マザーにそのまま装着できるというのもうれしい。既存Athlon 64ユーザーにとっては、予算さえ許せばぜひ乗り換えたい製品だ。難点は、4200+でも5万9000円、4800+では11万円という高価格と、まだ市場に登場していないという入手可能性の不安だ。

 Pentium D/XEは、3Dゲームやマルチスレッド化されていないアプリを主に使う前提だと、現状では乗り換え対象にはしずらい。ただ、両CPUメーカーがデュアルコア、マルチコア化に舵を切った以上、今後はアプリケーションのマルチスレッドは進むだろう。シングルスレッドの代名詞のような3Dゲームでも、今後はマルチスレッド化すると見る向きもある。「3DMark」で有名なFuturemark社は、「Mechanoids」という新しい3Dベンチマークを開発中であることが判明しているが、その内容は「3D描画のほかに、物理モデリングエンジンとAI処理のスレッドが動く」もので、Pentium XEとPentium 4とでは、格段の性能差が出ていた。実は「3DMark 05」においても、“CPU”のテストでは物理モデリングとAI処理を行なっており、「Mechanoids」の簡易版的なとらえ方をすることもできる。この結果は、Pentium 4 670よりPentium D 840がかなり速く、XEではさらに性能が伸びる。Athlon 64 X2も4000+から大きくスコアアップし、XEと横並びだ。


グラフ10・「3DMark 05」の結果

 実際にこのような方向に3Dゲームが進化するのであれば、いずれはデュアルコアCPUだけですべてをまかなえることになるのかもしれないが、しばらくはインテルユーザーは3Dゲーム目的なのか、エンコード目的なのかでCPUを選び分ける必要がありそうだ。

 一方、エンコードや、複数アプリを同時実行することが多い人には、Pentium Dは“本当のデュアルCPU”を、比較的安価に実現してくれる、注目の選択肢だ。なにしろ3万円そこそこで販売されているPentium D 820でさえ、8万円以上はしそうなPentium 4 670や10万円のPentium 4 XE 3.73GHzより、TMPGEncでもWindows Media EncoderでもCinebenchでも高速なのだ。DDR2しかサポートしない945マザーを買う必要があるが、DDR2メモリは劇的に値下がりしたし、ICH7R搭載マザーを選べば、従来高嶺の花だった3GbpsのSATA2やRAID5が使えるというメリットもある。

月刊アスキー6月号
月刊アスキー6月号

 なお、発売中の月刊アスキー6月号は、特集1でこれらCPUの用途別コストパフォーマンス比較や、デュアルコアのアーキテクチャ解説などを展開しているほか、32ページの大特集「ドカーン!とテラバイト超ストレージ」、格安ソフトの使い勝手を検証する「激安ソフト“太鼓判!”大調査」など注目&お役立ち記事満載! ぜひお手にとってご覧ください。

【関連記事】

(月刊アスキー編集部 野口岳郎)




[通常ページに戻る]
ASCII24 http://ascii24.com/
Copyright (C)2000-2008 ASCII Corporation. All rights reserved.