<独自ベンチマーク・プログラムについて>
・純粋に CPU単独の性能比較を主眼にする
・GUI関連の処理がないWindowsコマンドラインプログラム
・シングルスレッドプログラム
・倍精度実数/4バイト整数混在の演算処理
・実務アプリケーションの中で使われている処理(アルゴリズム)を採用
・実行中ページングが発生しない程度のメモリ確保
<テストの留意点>
・テストモジュールはコンパイラは変わっても、全て同じソースコード(32/64bitコンパチブル・ソース)
・64bitCPU普及の過程では32bitアプリケーションの利用は避けられないため、32bitコードの速度も比較対象に
<用意したテストモジュールと実行方法>
以下20種類のプログラムは、全てソースコードは共通です。一度保存してコマンドライン(cmd,コマンドプロンプト)で実行すると処理時間が表示されます。

※上記テストモジュールは、 「シバのHOMEPAGE」の「Nocona Xeon Review」でもテストいただいています。
★AMD64系CPU(Athlon64/Opteron)のベンチマーク・テスト
・アーキテクチャーの特性からAthlon64に関しては32bitと64bitのOSの比較も
行いました。
・SSE,SSE2インストラクションがサポートされているため、それぞれの最適化
モジュールでも比較しています。
<Athlon64 3200+/2.0GHz>
テスト用ベースマシン:マウスコンピュータ製 MDV EXTREME 7000RX
モジュール名 (.exe) |
アドレッシング |
Windows 2000(32bit)
日本語/出荷版 (msec) |
Windows XP Professional(32bit)
日本語/出荷版 (msec) |
Windows XP Professional(64bit)
英語/ベータ版 (msec) |
備考 |
| vc6 |
32bit |
4,735 |
4,735 |
4,735 |
32bitと64bitのOSで明確な違い無し |
| vcn |
〃 |
3,516 |
3,516 |
3,531 |
〃 |
| vcn_sse |
〃 |
3,219 |
3,219 |
3,281 |
〃 |
| vcn_sse2 |
〃 |
2,844 |
2,860 |
2,844 |
〃 |
| vcw |
〃 |
3,250 |
3,250 |
3,250 |
〃 |
| vcw_sse |
〃 |
2,953 |
2,938 |
2,938 |
〃 |
| vcw_sse2 |
〃 |
2,672 |
2,672 |
2,656 |
〃 |
| i7 |
〃 |
4,422 |
4,422 |
4,422 |
〃 |
| i7_sse |
〃 |
3,828 |
3,828 |
3,828 |
〃 |
| i7_sse2 |
〃 |
3,047 |
3,047 |
3,031 |
〃 |
| i8 |
〃 |
4,422 |
4,453 |
4,406 |
〃 |
| i8_sse |
〃 |
4,641 |
4,641 |
4,625 |
〃 |
| i8_sse2 |
〃 |
3,578 |
3,563 |
3,563 |
〃 |
| i8_sse2n |
〃 |
動作不能 |
動作不能 |
動作不能 |
警告メッセージ |
| i8_m |
〃 |
〃 |
〃 |
〃 |
〃 |
| i8_sse3 |
〃 |
〃 |
〃 |
〃 |
〃 |
| sdk_amd64 |
64bit |
無効 |
無効 |
2,562 |
64bitアプリケーションは64bitOS上でのみ実行可能 |
| i8_em64t |
64bit |
無効 |
無効 |
3,610 |
〃 |
※Intel C++8.0以降に追加された最適化オプション(例:/QxN)では、
Intel系CPU以外では動作不能にしている可能性あり?
<Dual Xeon(Nocona)2.8GHz>
テスト用ベースマシン:Storm製
Odysseia
モジュール名 (.exe) |
アドレッシング |
Windows XP Professional
日本語/出荷版 (msec) |
Windows Server2003(64bit)
英語/ベータ版 build1218 (msec) |
備考 |
| vc6 |
32bit |
6,235 |
6.203 |
32bitと64bitのOSで明確な違い無し |
| vcn |
〃 |
5,813 |
5,813 |
〃 |
| vcn_sse |
〃 |
3,860 |
3,875 |
〃 |
| vcn_sse2 |
〃 |
3,422 |
3,406 |
〃 |
| vcw |
〃 |
5,594 |
5,610 |
〃 |
| vcw_sse |
〃 |
3,266 |
3,297 |
〃 |
| vcw_sse2 |
〃 |
3,328 |
3,344 |
〃 |
| i7 |
〃 |
5,235 |
5,250 |
〃 |
| i7_sse |
〃 |
5,281 |
5,297 |
〃 |
| i7_sse2 |
〃 |
3,235 |
3,250 |
〃 |
| i8 |
〃 |
5,235 |
5,219 |
〃 |
| i8_sse |
〃 |
5,297 |
5,297 |
〃 |
| i8_sse2 |
〃 |
3,203 |
3,235 |
〃 |
| i8_sse2n |
〃 |
3,187 |
3,188 |
〃 |
| i8_m |
〃 |
3,485 |
3,500 |
〃 |
| i8_sse3 |
〃 |
3,235 |
3,235 |
〃 |
| sdk_amd64 |
64bit |
無効 |
4,109 |
64bitアプリケーションは64bitOS上でのみ実行可能 |
| i8_em64t |
64bit |
無効 |
3,344 |
〃 |
※一般無償公開されている Windows XP 64bit Edition(Build.1218) Preview版におけるテストも行いましたが、Server2003(64bit)の上記結果と特に変わりがないため省略いたします。
※以前掲載していました64bit Longhornの結果に関しましては、とりあえず処理は行っているのですが、どうも異常に遅いようです。未だ対応が行われていないものと判断し結果を削除しました。
★IA64系CPUのベンチマーク・テスト
・ひとつ目の表が IA-32 Execution Layerなしの状態のもので、2つ目の表がインストールした状態でのものです。
<Itanium2(McKinley)900MHz>
テスト用ベースマシン:HP製
Workstation zx2000
モジュール名 (.exe) |
アドレッ シング |
Windows Server2003 Enterprise(64bit)
日本語/出荷版 (msec) |
Windows XP 64bit Edition
英語/出荷版 (msec) |
備考 |
| vc6 |
32bit |
91,820 |
91,768 |
- |
| vcn |
〃 |
71,530 |
71,500 |
- |
| vcn_sse |
〃 |
66,150 |
65,520 |
- |
| vcn_sse2 |
〃 |
エラー |
エラー |
SSE2未対応 |
| vcw |
〃 |
70,780 |
70,800 |
- |
| vcw_sse |
〃 |
62,430 |
62,420 |
- |
| vcw_sse2 |
〃 |
エラー |
エラー |
SSE2未対応 |
| i7 |
〃 |
82,720 |
82,660 |
- |
| i7_sse |
〃 |
81,920 |
81,870 |
- |
| i7_sse2 |
〃 |
エラー |
エラー |
SSE2未対応 |
| i8 |
〃 |
83,450 |
83,390 |
- |
| i8_sse |
〃 |
81,920 |
81,870 |
- |
| i8_sse2 |
〃 |
エラー |
エラー |
SSE2未対応 |
| i8_sse2n |
〃 |
動作不能 |
動作不能 |
警告メッセージ |
| i8_m |
〃 |
〃 |
〃 |
〃 |
| i8_sse3 |
〃 |
〃 |
〃 |
〃 |
| i7_ia64 |
64bit |
13,430 |
13,430 |
- |
| i8_ia64 |
〃 |
13,470 |
13,460 |
- |
| sdk_ia64 |
〃 |
10,940 |
10,940 |
- |
<Itanium2(McKinley)/900MHz + IA-32 Execution Layer 4.3>
モジュール名 (.exe) |
アドレッ シング |
Windows Server2003 Enterprise(64bit)
日本語/出荷版 (msec) |
Windows XP 64bit Edition
英語/出荷版 (msec) |
備考 |
| vc6 |
32bit |
40,060 |
40,040 |
- |
| vcn |
〃 |
45,590 |
45,560 |
- |
| vcn_sse |
〃 |
12,920 |
12,940 |
かなり高速化? |
| vcn_sse2 |
〃 |
21,450 |
21,490 |
- |
| vcw |
〃 |
43,870 |
43,850 |
- |
| vcw_sse |
〃 |
13,060 |
13,050 |
- |
| vcw_sse2 |
〃 |
20,780 |
20,780 |
- |
| i7 |
〃 |
39,300 |
39,270 |
- |
| i7_sse |
〃 |
39,270 |
39,240 |
- |
| i7_sse2 |
〃 |
24,800 |
24,780 |
- |
| i8 |
〃 |
39,300 |
39,450 |
- |
| i8_sse |
〃 |
39,340 |
39,470 |
- |
| i8_sse2 |
〃 |
24,860 |
24,860 |
- |
| i8_sse2n |
〃 |
24,850 |
24,860 |
- |
| i8_m |
〃 |
15,880 |
16,000 |
まずまず高速 |
| i8_sse3 |
〃 |
動作不能 |
動作不能 |
警告メッセージ |
| i7_ia64 |
64bit |
13,440 |
13,460 |
- |
| i8_ia64 |
〃 |
13,480 |
13,470 |
- |
| sdk_ia64 |
〃 |
10,940 |
10,933 |
- |
※IA-32 Execution Layer 4.3をインストールするとSSE2命令を含むものやPentiumM最適化版も実行可能になるようです。今後のバージョンアップ次第ではSSE3も対応されてくる可能性はあるかもしれません。
<注意>
・本ベンチマークテストの結果を評価するには、最低限
IA64と
AMD64(X86-64)の両アーキテクチャー
の基礎知識が必要です。
・IA64とAMD64のサンプルCPUは、それぞれ現時点での最高スペックのものでは
ありません。最もパフォーマンスの高いものを調べるには実測が一番確実ですが、
当方が一時的に行ったテストでは、それぞれほぼクロックの比率を反映した速度に
なっていることが確認できています。
・IA64とAMD64のサンプルCPUのクロックが2倍以上異なるため、比較する場合は
それなりの比率を考慮して下さい。
★参考までにPentium4 2.8C(GHz)のベンチマークテスト結果
<Pentium4 2.8GHz(Hyper Threading対応)>
テスト用ベースマシン:ソフマップ製
コンピュータ(極盛)
モジュール名 (.exe) |
アドレッ シング |
Windows 2000(32bit)
日本語/出荷版 (msec) |
Windows XP Professional(32bit)
日本語/出荷版 (msec) |
備考 |
| vc6 |
32bit |
6,157 |
4,422 |
HT効果のためか? XPの方がかなり高速 |
| vcn |
〃 |
6,188 |
4,219 |
〃 |
| vcn_sse |
〃 |
5,000 |
3,484 |
〃 |
| vcn_sse2 |
〃 |
3,922 |
2,953 |
〃 |
| vcw |
〃 |
5,282 |
4,079 |
〃 |
| vcw_sse |
〃 |
3,938 |
2,829 |
〃 |
| vcw_sse2 |
〃 |
3,797 |
2,844 |
〃 |
| i7 |
〃 |
6,235 |
3,812 |
〃 |
| i7_sse |
〃 |
6,313 |
3,907 |
〃 |
| i7_sse2 |
〃 |
3,641 |
2,547 |
〃 |
| i8 |
〃 |
6,250 |
3,797 |
〃 |
| i8_sse |
〃 |
6,313 |
4,000 |
〃 |
| i8_sse2 |
〃 |
3,672 |
2,531 |
〃 |
| i8_sse2n |
〃 |
3,657 |
2,516 |
〃 |
| i8_m |
〃 |
4,297 |
2,818 |
〃 |
| i8_sse3 |
〃 |
動作不能 |
動作不能 |
警告メッセージ |
|