Akiba2GO!

【最新パーツ性能チェック(Vol.26)】Nocona登場! Pentium 4-3.6GHz以上の性能を安価に実現できるか?


2004年7月29日

 2月にデスクトップ用のPentium 4が90nmプロセスのPrescottに移行したが、それから遅れること4ヵ月、ようやくサーバー用CPU Xeonも90nmの“Nocona”コアに移行した。
 Prescott相当のコアになった、と聞いてもあまりありがたみを感じないかも知れないが、Noconaでは重大な性能向上が図られている。長らく533MHz止まりだったFSBが、ようやくデスクトップPentium 4と同じ800MHzになったのである。

アスキープラス9月号発売開始!

LGA775CPU&マザー、ソケット939CPU&マザーの登場で空前の難しさになっている自作パーツ選びのナビゲーション「あんしん&高性能の新・定番マザーボード選び」、ますます暑くなる日本の夏を乗り切る「UPS・水冷・ガス冷で夏のパソコンを守る」の大特集に加え、出そろった最新ビデオカード選び、デュアルレイヤーDVD+R選び、あっと驚く個性派PCケース作りなど、自作&チューニングのためのお買い物と活用術を満載して29日から書店で皆様をお待ちしています!


単体でもPrescottと張り合える

Noconaのパッケージ。ES品なので、本来なら入るXEONの刻印がない
Noconaの裏面。従来のXeon同様の604ピンPPGAだ

 XeonはデュアルCPU構成が可能で、高いCPU性能が求められるサーバ/ワークステーション向け。当然その性能はデスクトップのPentium 4より高いことを期待したくなるが、現実は必ずしもそうではなかった。

 Pentium 4コアの初代Xeon(コードネーム:Foster)は、CPU単体の性能はPentium 4(コードネーム:Willamette)と同じで、デュアル構成が可能という明確な上位CPUだった。2002年2月には、Pentium 4より9ヵ月も早くHyper Threadingを装備もした。しかし、Pentium 4は同年5月にFSBを533にアップ、Xeonは11月に追いついたものの、Pentium 4は11月の3.06GHz版でついにXeonのお株のHTを搭載、翌2003年4月にはFSB 800MHz化を果たして、単体での性能では完全に優位に立った。

 これではXeonのメリットも薄れてしまう。そこでIntelはXeonに3次キャッシュを搭載するという奥の手を使ったが、FSBは高速化されていないので、同クロックのFSB 800のPentium 4には依然及ばないことも少なくない。

 Noconaは、FSBの大きなビハインドを1年ぶりに挽回した。クロックも従来は最高3.2GHzまでだったところ、今回は上は3.6GHzまで用意し、これもPrescottに並んだ。さらに、Noconaでは最初から64ビットOSを走らせられる新アーキテクチャ“EM64T”に対応している。加えて、負荷に応じて3段階にクロックを調整する拡張版スピードステップも内蔵し、消費電力の削減も図っている。つまり、単体でも明らかにPentium 4よりも高性能、高機能なCPUとして再登場したわけだ。



Sandra 2004 SP1で見たCPUID。Noconaと表示され、メモリ空間は物理36bit、論理48bitと出る。従来のPentium 4やXeonでは順に36bit/32bitだから、確かに拡張されている。EM64Tもありと表示される。No Executionはまだ未対応なのは発表どおりだが、拡張版スピードステップも未対応になっているのはES品だからか?

ちなみにCPUのパッケージは従来のXeonと同じ、PPGA604のままだ。ピンが十分多かったので、3.4/3.6GHz版の投入に際してもパッケージを変えずにすんだのだろう。

NoconaとPrescott(755)の標準価格は以下の通り。

- Nocona Prescott
3.4GHz EE - 11万4200円
3.6GHz 9万4660円 7万2820円
3.4GHz 7万6590円 7万2820円
3.2GHz 5万500円 3万1780円
3GHz 3万5070円 2万4920円
2.8GHz 2万3190円 2万350円

 Noconaは同クロックのPrescottより高価とはいえ、低クロック製品ならハイエンドのPrescottよりはるかに安い。そこで誰しも思いつくのは、安いXeonを2つ買えば、高いPrescottを1つ買うより高性能になるのではないか、ということだ。たとえば2.8GHzのNoconaを2つ用意すれば、作業が2つのCPUにきれいに分散し、バス競合やスヌーピングオーバーヘッドなどがまったくない理想的な環境なら、単体のPentium 4にして5.6GHz相当の速度になるはずだ。現実はそんなに理想どおりにはいかないわけだが、では、実際にはどれくらいの性能になるのだろうか。本稿はそれを検証していく。



マザー/チップセットはどうなる?

 CPUの形は従来と変わらないと述べたが、だからといって、Noconaが従来のXeonマザーに装着できるというわけではない。それは当たり前で、なにしろNoconaではFSBが800MHzになっているのに、従来のXeon用チップセットのほとんどは533MHzまでしかサポートしていないからだ。

 IntelはNoconaと同時に、FSB800対応の新チップセット“E7525”(コードネーム“Turnwater”)を投入した。FSB800対応に加え、ビデオカードの接続にはPCI Express x16を使用するという最新仕様のスペックだ。MCH(ノースブリッジ)からはこのほかにPCI Express x8インターフェイスとHUBインターフェイスが1本ずつ出ている。基本的にはx8のほうにPCI-Xブリッジ“6700PXH”、HUBのほうには“ICH5(R)”または“6300ESB(いわゆるHance Rapids)”を接続する。

 ただし、E7525がサポートするのはDDRが333(PC2700)、DDR2が400(PC2-3200)までで、モジュールはレジスタードが必要。これでは、個人ユーザーがPrescott対抗として考えるにはメモリのコストがばかにならない。そこで注目されるのが、i875PベースのデュアルXeonマザーだ。
 ご存じのように“i875P”はPentium 4用であり、デュアルCPUはサポートしていないはず。にもかかわらず、市場にはi875ベースのXeonマザーがいくつも登場している。なかでも、IWillの「DH800」は、Nocona登場前から「FSB800の次世代Xeonに対応」することをうたってきた。
 i875であればFSB800に対応しているのは当たり前。さらにうれしいのは、メモリに普通の(アンバッファードの)DDR400(PC3200)が使えることだ。FSB 800ならメモリは400MHzにしたい。E7525のように高価なレジスタードDDR2-400を使わずとも6.4GB/秒のメモリ性能が得られるのはありがたいことだ。


IWillのデュアルXeonマザー『DH800』。新旧のXeon(PrestoniaとNocona)に両対応という珍しいボードだ

Noconaのヒートシンクは4つのネジで留めるようになった。Prestoniaの扱いずらい留め金に比べるとずいぶん便利になった

サウスブリッジはHanceRapidsこと6300ESB。64bit/66MHzまでのPCI-Xをサポートする

 というわけで、今回はDH800にNocona 3.2GHz×2という構成を組み、どのようなパフォーマンスが得られるかをチェックしてみた。



シングル時の性能は同等、デュアルなら激速!

グラフ1 Sandra CPU
グラフ2 Sandra メモリ
グラフ3 3DMark 03
グラフ4 Final Fantasy XI ver.2
グラフ5 Unreal Tournament 2003
グラフ6 PCMark 04
グラフ7 CineBench
グラフ8 WMV
グラフ9 TMPGEnc 3

 グラフ1、2はSandraによるCPUとメモリ性能測定。CPU性能はシングル時、およびPrescott+875とほぼ同じ、デュアル時には見事に倍になっている。このテストはマルチCPUの理想的なピーク速度を計算するものなので、まあ、倍になって当然である。ただ、メモリ性能については、PrescottよりもXeonのほうが、シングル時に6%、デュアル時には21%も低下している。

 メモリ性能はマザーボードによって多少は異なるので、厳密に一致しないのは仕方がないが、ほぼ同条件のシングル時に6%違うのは、ちょっと気になる。Xeon自身の事情があるのかもしれない。が、もっと気になるのはデュアル時の大きな差だ。本当にこれだけ遅かったら、スレッドが1つしかない(=CPUが1個しか動かない)アプリでは相当性能が落ちてしまうはずだからだ。

 しかし、Professionalhearts製メモリアクセスベンチでは、シングル時もデュアル時も変わらず4800MB/秒という性能が得られた。また、後ろで見ていくが、デュアル時にシングルスレッドのテストの性能が大きく落ちるという結果もない。どうもこれはSandraのメモリベンチが、マルチスレッドに対応していることがアダになっているだけのようだ。デュアルXeonマシンで4つのスレッドが終始、1つしかないCPUバスとメモリを取り合うことのオーバーヘッド、メモリアクセスの場所が連続しなくなる非効率が出ているものと思われる。現実のアプリケーションでは、全スレッドがメモリアクセスばかりを続けることはなく、このような速度低下が実際に現れることはないものと考えられる。 

 さて、いよいよリアルなベンチマークに入ろう。グラフ3〜5は3Dゲーム系のベンチマークの結果だが、Prescott 3.2GHzとXeon 3.2GHzシングルの性能差はわずかだ。NoconaとPrescottは、単体での性能は期待どおり同等と言って良さそうだ。いっぽう、Xeonのシングル、デュアルでも、これまたスコアはほぼタイ。わずかにシングルが速いようだ。このことから、これらのテストはいずれも1つのスレッドしか使っていないことがわかる。

 さて、いよいよマルチスレッドに対応したアプリの性能を見ていきたい。まずはPCMark04。トータルスコアで13%、CPUテストについては19%も性能アップしている。実際にはPCMarkのテストのうち、マルチスレッドの意味があるものはメインテストで40%、CPUテストで43%にすぎないことを考えれば、かなりの性能向上が得られることがわかる。

 マルチスレッド対応のレンダリングエンジンを持つCinebench 2003の結果は驚愕的だ。スコア606は、シングルのPrescott 3.2GHzの1.8倍! 当然のごとく、このスコアはPrescott 3.6GHzの378を足下にも寄せ付けないスピードだ。

 マルチスレッド化が進むエンコード系の例として、TMPGEnc 3とWindows Media Videoの結果はグラフ8、9。WMVのほうはシングルの45%アップ。TMPGEncに至っては、標準モードで65%、負荷の重い最高画質では実に83%も速い。もちろんPrescott 3.6GHzと比較しても大差のリードだ。





 

エンコードするならXeonがおトク

 まとめると、デュアルNoconaマシンの速度は、シングルスレッドのアプリにおいては同クロックのPrescott相当の性能で、マルチスレッド化されたアプリに対しては、最高80%ほども高速になる、ということになる。
 したがって、Nocona Xeon 3.6GHzを買えば、3DゲームのようなシングルスレッドアプリでもPrescott Pentium 4-3.6GHzマシンと同等、マルチスレッド対応アプリなら2倍近い性能というモンスターマシンを作れることになる。ただ、Xeon 3.6GHzは1個10万円。デュアルにしたら、マザーとCPUだけで25万円コースだ。
 ベンチマークで使った3.2GHz品なら、1個6万円弱。2つ買うとなるとPrescott 3.6GHz(8万円弱)よりはかなり高くなるうえ、シングルスレッド系はクロックが低い分遅くなるので、高速CPUを生かす目的が主に3Dゲームの快適さの向上である場合には、現状ではXeonよりPrescottのほうがいいということになる。しかし、マルチスレッドに対応したエンコーダであれば、3.2GHzデュアルでもPrescott 3.6GHzよりはるかに高速だ。
 ことWMVとTMPGEncについては、Xeonは3GHz、あるいは2.8GHzまで落としても、Prescott 3.6GHzを余裕で上回るのは確定的だ。Xeon 2.8GHzならCPUは1個3万円弱、2つ買ってもPrescott 3.6GHzより安い。最速Prescottよりずっと速いマシンをより安く作れるという、画期的なストーリーになる。現実にはEPS12V対応の大容量電源の購入や、マザーボードが4万円以上するといった追加経費を考えると、Prescott 3.6GHzより安いかどうかは微妙だが、WMVとTMPGEncに関してはぐんと快適に使える。エンコード用途には、Nocona登場で「新たな最高速CPUが登場した」と言えるかもしれない。

(アスキープラス編集部 野口岳郎)




[通常ページに戻る]
ASCII24 http://ascii24.com/
Copyright (C)2000-2008 ASCII Corporation. All rights reserved.