【最新パーツ性能チェック Vol.40】待望のDDR2対応Athlon 64が登場! FX-62と5000+の性能はどこまで伸びるのか?
|
2006年5月23日
AMDはAthlon 64とSempronシリーズにDDR2対応の新バージョンを投入する。DDR2対応という意味ではインテルから約2年遅れたが、DDR2-800対応では先を越した。DDR2-666(PC5300)が潤沢に流通するようになったこの時期に、満を持しての登場といえる。新ラインアップ登場と同時に、エンスー向けFXシリーズには“62”が、メインストリームのデュアルコアには“5000+”が投入された。DDR2はAthlonの性能をどこまで引き上げるだろうか?
モデルナンバーとクロックの対応には変更なし
従来、Athlon 64シリーズは“FX”、“X2”を含め939ピン、エントリー向けの“Sempron”は754ピンという切り分けになっていたAMDのデスクトップCPUだが、DDR2対応版ではデスクトップはすべて940ピンの“ソケットAM2”となる。
CPUの外観やサイズは従来の939や754タイプと変わらない。ピンの間隔も同じなので、ひょっとして同じ940ピンのOpteron用マザーに装着できるのか、という疑問がわくが、それはできない。内部で8ヵ所、ピンが抜けている部分の配置が異なっているためだ。
見た目的には限りなくソケット939マザーに近いソケットAM2マザーだが、今回からヒートシンクのリテンションが4ヵ所でのねじ留めとなり、安定性が増した。これは、リテンションとマザーとの固定であり、ヒートシンク自体の取り付け方は変わっていないため、基本的には従来のソケット939用ファンが装着できる。
|
|
|
左からAthlon 64 FX62、Athlon 64-5000+、およびその裏面。パッケージそのもの、ピンの長さ、配置などはおなじみのソケット939と変わらないが、左下に1本ピンが多いことと、内部のピンの欠け方が異なるため、従来のソケット939マザーはもちろん、ソケット940マザーにも装着はできないようにできている |
|
|
テストに使用したAsusTekの「M2N32 SLI」。チップセットはnVIDIA製。サウスブリッジから6つのSATA端子が出ているほか、Silicon Image製チップも乗せて、7つめのオンボードSATA端子と、あと1つ、eSATA端子を用意している。ノース、サウスなどはヒートパイプで結ばれ、写真のようなファンでまとめて冷却する |
|
|
左は5000+、右がFX62の「CPUID」等。ともにステッピングが「F2」になっている。CPUIDは、5000+が、従来キャッシュ512KBのデュアルコアに割り振られていた2Bから4Bに変わっている。FX62のほうは、キャッシュ1MBのデュアルコアに割り振られていた23が43に変わっている |
 |

FX62のCPUスペックの詳細をSandra 2005で見たところ。「拡張された特長」の最後にある「Secure Virtual Machine」が、コードネーム“Pacifica”こと“AMD Virtualization Technology”のサポートを示している |
今回の製品のラインナップ
今回のラインナップは表1のとおり(Sempronは省いた)。
●表1 Socket AM2版Athlonラインナップ
| デュアルコア |
新ラインナップ |
新ラインナップ(LP) |
従来ラインナップ |
| 2.8GHz/1MB | FX62(125W) | - | - |
| 2.6GHz/1MB | - | - | FX60(110W) |
| 2.6GHz/512KB | 5000+(89W) | - | - |
| 2.4GHz/1MB | 4800+(89W) | 4800+(65W) | 4800+(110W) |
| 2.4GHz/512KB | 4600+(89W) | 4600+(65W) | 4600+(110W) |
| 2.2GHz/1MB | 4400+(89W) | 4400+(65W) | 4400+(110W/89W) |
| 2.2GHz/512KB | 4200+(89W) | 4200+(65W) | 4200+(89W) |
| 2GHz/1MB | 4000+(89W) | 4000+(65W) | - |
| 2GHz/512KB | 3800+(89W) | 3800+(65W/35W) | 3800+(89W) |
|
| シングルコア |
新ラインナップ |
新ラインナップ(LP) |
従来ラインナップ |
| 2.8GHz/1MB | - | - | FX57(104W) |
| 2.6GHz/1MB | - | - | FX55(104W) |
| 2.4GHz/1MB | - | - | 4000+(89W) |
| 2.4GHz/512KB | 3800+(62W) | - | 3800+(89W) |
| 2.2GHz/1MB | - | - | - |
| 2.2GHz/512KB | 3500+(62W) | 3500+(35W) | 3500+(89W/67W) |
| 2GHz/512KB | - | - | 3200+(67W) |
| 1.8GHz/512KB | - | - | 3000+(67W) |
|
※★LPは「低消費電力版」の略(製品名ではない)
見てのとおり、デュアルコア製品に通常電力版と低消費電力版がずらりと揃う一方、シングルコア製品は低消費電力版含めわずか3モデルに縮小しているのが目を引く。クロック的に、シングルコアの最上位であるFX57の2.8GHzにデュアルコア製品が今回追いついてしまったこともあり、シングルスレッドのアプリの速度を優先する場合であっても、あえてシングルコアの製品を選ぶ理由があまりなくなってしまった。「同じ値段を出すなら低クロックのデュアルコア製品より、少しでも高クロックのシングルコア製品を」という人向けにいくつかを残した、というところだろう。
もうひとつの注目は消費電力の低減だ。従来ハイエンドでは110Wを基本としてきたAthlon 64 X2がすべて89Wにそろえられたほか、4800+以下については65Wの“低消費電力版”が新登場。さらに3800+については35Wのバージョンまである。その一方で、フラッグシップのFX62については、従来比15Wアップ、AMD史上最大の125Wに引き上げられている。
さて、表を見るとすぐわかるとおり、今回DDR2対応にもかかわらず、クロック・キャッシュとモデルナンバーの対応には変更がない。AMDは、モデルナンバーは性能の相対的な上下関係を示す指標とし、従来、クロックが同じであっても性能が高ければ高いナンバーをつけてきた。今回DDR2メモリコントローラを内蔵したことで、いくらかの性能向上があるはずなのに、あえて従来とそろえてきたのはやや解せないところがあるが、従来のナンバリングを知っている人には、対応を覚え直さずにすむというメリットはある。
そもそもメモリ性能はどれくらいのインパクトを持つものなのか
今回テストするのは、FXの新たな最上位モデルとなるFX62(クロックがFX60から200MHz上がり、2.8GHzとなった)と、X2の最上位となる5000+(クロックが4800+から200MHz上がり、2.6GHzとなった。ただしキャッシュはコアあたり512KBで、4800+のコアあたり1MBよりは少ない)。
新シリーズの最大の特徴は、すでに述べたとおり、内蔵メモリコントローラがDDR2対応に切り替わったことだ。対応メモリはDDR2-400(PC2-3200)、DDR2-533(PC2-4300)、DDR2-666(PC2-5300)およびDDR2-800(PC2-6400)の4種。DDRには対応していない。
そのほか、消費電力削減のほか、新機能として、AMDの仮想化支援機構、コードネーム“Pacifica”こと“AMD Virtualization Technology”にも対応している。この機能を使った仮想化ソフトが登場した際に、スループットや安定性の向上が見込める。
さて、今回DDR2-800に対応したことで、ピークメモリ性能は従来(DDR-400)の2倍にまで向上することになる。ピーク性能だけでいえば、メモリのチャネル数を倍にしたのに匹敵する大幅な性能アップだが、果たしてこれは、実際のアプリケーションにおいてどの程度の性能向上をもたらすのだろうか?
BIOS設定でDDR2-400からDDR2-800までに変えて、メモリ性能がどう変わるかを確認したのがグラフ1と2だ。BIOSデフォルトだとクロックにかかわらず23-18-5-5-5という巨大レイテンシを入れられてしまうので、適宜修正した。DDR2-800の場合は、一般的なスペックとして、RC=21、RAS=16、CLなど=5に設定している。ただし今回借用したテストベッドにはCorsairの1066MHzのDDR2メモリが装着されていたので、現状最高速設定として、800MHzで18-12-4-4-4という設定でもテストし、これを「MAX」と表記している。
 |
グラフ1 「Sandra 2005」のMemory Bandwidthの結果。DDR2-400はDDR-400よりかなり性能が低い。また、DDR2-800でもあまり性能が上がっていない |
|
 |
グラフ2 「Everest Home 220」によるメモリリードの結果。伸び率は高くなったが、絶対的な数値としては毎秒5.5GBでは振るわない |
|
ご覧のとおり、最大2倍という期待からすると振るわない結果になった。FX62の場合、「Sandra 2005」では400とMAXの差がわずか28%。「Everest」でも36%アップにとどまった。絶対的なスコアとしても、理論値(12.8GB/秒)に対し7GB/秒ほどでは物足りない。なにしろDDR時代には理論値の6.4GBに対し、約90%に相当する5.8GBほどの値が出ているのだ。また、同じ400MHzの状態だと、DDRよりDDR2のほうがかなり遅い。
内部にボトルネックがあるのではないかと思いたくもなるが、Athlonシリーズは排他式キャッシュを採用していることもあり、メモリ性能を正しく測定するには困難がつきまとう。5000+については「Sandra 2007」が間に合ったので、こちらでもメモリ速度を計測したところ、DDR2-800利用時は7500と大きくスコアが伸びている。とはいえこれでもまだ理論性能の60%弱だ。テストアルゴリズムの問題はあるにせよ、やはりクロックが上がったことでさまざまなレイテンシが増え、DDR-400時代のような実効性能を出すのは困難になっているのは確かだろう。
FX62と5000+のメモリ性能の奇妙な変化
ところで、2つのテストのグラフを見ると、奇妙なことに気がつく。そう、同じメモリを使っているのに、FX62のほうが5000+よりメモリ性能が高くなっているのだ。まあ、メモリの性能を測っているつもりでも、コアの性能やキャッシュの量などが影響してしまっている、といって片付けるのは簡単だが、ではDDR2-400の場合には両者の差がないのはなぜだろう。さらに、「Everest」で見ると、DDR2-533、666については5000+のほうが速くなっている。
謎を解く鍵かもしれない情報がOpteronのデータシートに載っている。結論から言うと、Opteronのメモリ用クロックは、CPUクロックを整数分の1に分周して作っていることが示唆されている。たとえば2.4GHzのOpteronがDDR400(クロックは200MHz)をドライブするために、内部クロックを12分の1にして200MHzの信号を作っているわけだ。これはAthlon 64でも同じ構造だと思われる。
これまでのAthlon 64は、当然のようにDDR400を使ってきたが、CPUクロックが200MHzの倍数だったから、適当な値で分周すれば必ず200MHzジャストの信号を作ることができた。ところが今回、メモリクロックが上がったため、仮に従来どおりの手法でメモリクロックを作っていると問題が生じる。DDR2-800をドライブするには400MHzの信号を作る必要があるが、CPUのコアクロックが2.6GHzの場合、7分周すると371MHzでちょっと足りない。とは言っても6分周だと433MHzになってしまい規定をオーバーしてしまう、といった事態が発生するわけだ。具体的に言えば、FX62は2.8GHzだから、7分周でジャスト400MHzを作れるが、5000+は2.6GHzなので、7分周の371MHzで使わざるを得ないことになる。これはDDR2-800に限らず、他の設定においても、ジャストにあわせられない場合が出てくる。表にまとめてみた。かなりのケースで、ベストのクロックが作れないことがわかる。
表2 整数分周の場合の各メモリモジュールの実働クロック
| CPUクロック |
DDR(2)-400 |
DDR2-533 |
DDR2-666 |
DDR2-800 |
| 2000 | 400 | 500 | 667 | 800 |
| 2200 | 400 | 489 | 629 | 733 |
| 2400 | 400 | 533 | 600 | 800 |
| 2600 | 400 | 520 | 650 | 743 |
| 2800 | 400 | 509 | 622 | 800 |
|
これはあくまで仮説であり、コアとは非同期にメモリクロックを出せるようにしたとか、あるいは0.5単位で分周できるようにした、という可能性がないわけではない。ただ「Everest」の計測結果は、この表の数値と非常によく一致する。つまり、DDR2-800設定だと5000+の性能が振るわないが、666や533だとFX62より5000+が速くなっている、という現象をうまく説明できる。実際問題、800MHzのうち20MHzや30MHz違ったところで実使用レベルでわかるような差にはなりはしないが、こだわる方は購入前にデータシートをあたるなどしたほうがいいかもしれない。
 |

「CPUZ」で見た5000+のメモリステータス。BIOSではDDR2-800に設定しているのに、メモリクロックはコアを7分周した371MHzと表示されている。この表示が正しければ、CPUのクロックと利用するモジュールによる実メモリクロックは上の表のようになるはずである |
メモリクロックでアプリ性能はどう伸びるか
前置きが長くなったが、次に、FX60(DDR)とFX62(DDR2)を例にとり、メモリの違いによってどれほどの差が出るかを確認してみよう。グラフ3〜10をごらんいただきたい。
なんと、「Superπ」と「3DMark 05」において、クロックが低いFX60のほうがFX62のDDR2-400より速くなっている。上で見たように、DDR2-400がDDR-400より遅いことが足を引っ張ったのだろうが、それにしてもCPU自体の7.7%のクロック差がひっくりかえるというのは尋常ではない。ある意味十分に枯れ、チューニングされたDDRベースのシステムに対し、DDR2のシステムがまだ発展途上という点も不利に働いたと考えるしかない。
他のテストについていえば、FX62+DDR2-400であってもFX60+DDR-400を上回っており、DDR2-800の最速設定なら、FX60+DDRに比べ7〜8%速くなっている。このうちクロックの効果とメモリの効果がどれだけずつなのかを判別するのは難しいが、メモリ単体ベースではDDR2-533時でDDR-400と同じくらいなので、DDR2-533のスコアを「プラットフォーム変更がなかった場合の基準値」と見て、DDR2-666や800を使うことでグラフのような性能向上が得られた、と理解することは一応は可能だろう。ただ、クロックが7.7%高いことを考えると、DDR2-800やDDR2-666がDDR400プラットフォームに対して明らかな性能の上積みを果たした、と言えるほどの性能にはなっていないのも事実だ。メモリの厳密な効果については、同クロック・同キャッシュのCPUでプラットフォーム間比較をしないとはっきりしたことは言えない。
 |
グラフ3 円周率計算ソフト「Superπ」の所要時間の変化(単位は秒。棒が短いほど高速) |
|
 |
グラフ4 3Dゲームベンチ「Commanche4」のスコアの変化 |
|
 |
グラフ5 マルチタスクテスト「PCMark 05」のスコアの変化 |
|
 |
グラフ6 CGレンダリングテスト「Cinebench」のスコアの変化 |
|
 |
グラフ7 マルチタスク型ゲーム「3DMark 05 CPU」のスコアの変化 |
|
 |
グラフ8 「TMPGEnc 4」による動画のMPEG2圧縮の所要時間の変化(単位は秒、短いほど高速。FX60のデータはなし) |
|
 |
グラフ9 「TMPGEnc 4」による動画のMPEG4圧縮の所要時間の変化(単位は秒、短いほど高速。FX60のデータはなし) |
|
 |
グラフ10 「Windows Media Encoder 9」による動画のWMV圧縮の所要時間の変化(単位は秒、短いほど高速) |
|
未踏の領域へリードを広げConroeを待つ
最後に主なハイエンドCPUを並べ、性能を比較してみた(グラフ11〜20)。なお、現状ではDDR2-800は入手困難かつ高価であるため、メインストリームの最上位である5000+については、手ごろなDDR2-666と、一般的と思われるスペックのDDR2-800の設定で計測した。FXについては究極性能追求ということで、一般的なDDR2-800の設定のほか、上で述べたCL=4という高速設定の値を掲載している。
FX62はオールラウンドに強みを見せるが、Pentium陣営には現在XE 965が登場しており、955の結果からすると、「PCMark 05」(CPU)でぶっちぎりとなるほか、「3DMark 05」、「Cinebench」、「WMV Advanced Profile」、「DivX 6.1」ではFX60を脅かす性能が予想される。FX62はこうした「穴」をふさぎつつ、オールマイティな最速CPU「FX」の座を固めたといえる。また、5000+も、一部キャッシュが少ないために3D系で4800+に及ばないテストがあるものの、着実な高性能化を果たしている。
そろそろ過去のものとなりつつあるDDRと手を切って最新最速の800MHzメモリが使え、デュアルコアには4000+や5000+といった新顔も追加。低消費電力タイプも選べるようになった新しいAthlon 64は、「マルチコア化」と「ワット性能重視」のトレンドを反映した、素直だが意欲的なラインナップが特徴的だ。
 |
グラフ11 シングルスレッド:「Superπ」による円周率104万桁の計算時間(単位は秒、短いほど高速) |
|
 |
グラフ12 シングルスレッド:「DGCA」によるファイル圧縮時間(単位は秒、短いほど高速) |
|
 |
グラフ13 シングルスレッド・3D:「3DMark 2001」によるゲーム画面描画テストのスコア |
|
 |
グラフ14 シングルスレッド・3D:「Commanche 4」によるゲーム画面描画テストのスコア |
|
 |
グラフ15 マルチスレッド・3D:「3DMark 05」によるマルチスレッドタイプのゲーム画面描画テストのスコア |
|
 |
グラフ16 マルチスレッド・CG:「Cinebench 2003」によるCG描画テストのスコア |
|
 |
グラフ17 マルチスレッド:「PCMark 05」による最大4スレッドのマルチタスクテストのスコア |
|
 |
グラフ18 デュアルスレッド:「Windows Media Encoder 9」によるWMVファイル作成時間(単位は秒、短いほど高速) |
|
 |
グラフ19 マルチスレッド:「Widows Media Encoder 9 Advanced Profile」によるWMVファイル作成時間(単位は秒、短いほど高速) |
|
 |
グラフ20 マルチスレッド:「DivX 6.1」による動画のDivX形式での圧縮時間(単位は秒、短いほど高速) |
|
【関連記事】
(月刊アスキー編集部 野口岳郎)
|