ホーム 道しるべ 憩いの広場 濃緑空間 濃緑研の日記

FPU・SIMD濃緑研究所

 

ベンチマークサーキット
3DNow!で遊ぼう
トピック
重力シミュレーション
うるりさんの物置
リンク
更新履歴

Sorry, this page is Japanese Only.

このページの最終更新日は 07/06/20 です。

Since 1999/4/10

文責:  岩田 一成
問い合わせはまで

PentiumU・Celeron・PentiumVのFPU能力は本当にK6コアのFPU能力より高いのか?
単精度浮動小数点SIMD能力は3DNow!とSSEどちらに軍配が?
Athlonの実力やいかに?
Pentium4とはいかなるCPUなのか
Athlon64、intel-Core、Core2は?

ただいま別館【濃緑空間】でRound1:Orbit Round2:DCT Matrix
Pentium4、Athlon64、PentiumM、Intel Core、Intel Core 2計測結果速報中です。

またRound2の計測結果をこちらPDFファイルにまとめています。
Core2 SSE は倍早いということです。2007年1月20日更新)

最近のCPUは省電力機構を備えているため、システムによっては
 動作周波数がCPU負荷に応じて変化します。

計測に使用しているAthlon64、PentiumM、Core2環境が
そのような設定で計測値が?であったため再計測を実施しました。

当サイトで道に迷われたらどうぞ道しるべを参考にしてください。

当サイトに御立ち寄りの際は、どうぞこちら(憩いの広場)にて足跡でもお残しください。

新着情報

ベンチマークサーキット

07/01/13

Round2

公式結果 II を追加 Athlon64、Core2の結果を一部掲載
計測結果はこちらのPDFファイル

01/11/11

Round2

ThunderbirdAthlonの計測結果追加
K7Athlonと大きな差は無し。
Pen4 SSEは評判通りの速さを実証。

01/11/10

Round2

公式計測結果追加
Pen4 環境:i850チップセットRDRAM 256M
Coppermine(PC133-733MHz)

01/11/05

Round2

Pentuim4計測結果

99/10/18

Round2

公式計測結果速報!

主要互換CPU全計測結果掲載
Athlonの結果追加(10/31)

サーキット整備班」をご参照ください。

出走コード
うるりさん
Kazu
Danteさん(1999/10/30)
黒い彗星さん(1999/11/16)・LZH

99/8/13

Round1

★★★F3ベンチマークサーキットRound1公式戦★★★
主要CPUアーキテクチャ全結果掲載
MIIおよびmP6のコンパイラコード計測結果追加

Athlonの異常なFPUの実力
Athlon3DNow!がK6-3DNow!・KNI(SSE)より遅い!?

KNI(SSE)仕様SISDコードが好走
KNI(SSE)仕様SIMDにはつらいコース設定
DLLエントリの手引きページ公開

トピック 99/8/15 Athlonの実数演算 ベンチマークサーキットでのAthlonの結果から評価してみました。
99/8/05 固定小数点概観 Round2暫定参戦コード公開
暫定DLLはこちら
99/8/05 固定小数点概観 浮動<--->固定変換・正規化ツール
(7/25)掛け算・割り算での使用例をアップ
(8/05)正規化の不具合修正、小数点位置移動ルーチン追加
99/7/25 固定小数点概観 座標変換に挑戦(コードのみ公表)
しかし思ったほど速くない、
今回のコードはPentiumIIで走らせた方が速い
どした?整数演算に強いK6
99/7/20 固定小数点概観 符号付き除算
99/7/18 固定小数点概観 夏休み企画:固定小数点概観
実数演算を整数命令で実演します。

3DNow!で遊ぼう

99/7/11

配列演算総括(配列演算速度を比較してみました)
素直に組んだコードでは
K6FPU = 2*P6FPU = 2*3DNow!でした。
また3DNow!SISDはP6FPUと3DNow!SIMDの中間っていうところでした。
PentiumIIの値を正式計測(7/12)

3DNow!SISDと比較
99/7/04 x86FPUとの比較
配列演算の最適化II(数%の改善、やはりいまひとつ)
ペアリング以外の最適化指針

うるりさんの物置

99/6/07 うるりさんがRound1のまとめをしてくれました

重力シミュレーション

99/6/02 物理計算量とFPSの関係計測結果更新
K6-III/450による計測結果追加
Direct3Dの負荷を軽減した場合と
物理計算をFPUで行った結果も追加
上と同様の測定を新たにPentiumIIでも実施(6/2)

F3ベンチマークサーキット

Round1公式計測

うるりの物置にて公式戦詳報!

Round2 公式計測

Athlon、KNI(SSE)エンジン搭載コード募集中

申し込み問い合わせは憩いの広場にて

 地球上空200kmから時速7.92km/sで水平に打ち出された衛星の軌道計算を基に処理速度を計測した。
 1秒間隔で位置計算を行い、24,000万回繰り返しに要する時間を調べたものである。
 およそ6000回で地球を1周しており、約4万周にわたる位置を計算していることになる。
 性能比較のため、あえて平方根(√)、除算部分を省いたものも計測してみた。
 ここに興味深い事実が顕れている。
 なんと浮動小数点数演算に強いといわれている
PentiumIIが 意外に単独の平方根・除算に弱い のである。
 さすがにロジック内に複数の平方根・除算を入れるとパイプラインが有効に機能するのか、K6との差がでるようである。
が、はっきりいって、
マイクロプログラムはK6の方が優秀なようである

CPU別性能比較(単精度/倍精度 単位:秒)
CPU 全処理 √・除算省く √省く 2倍の演算 RungeKutta
Pro200 160/157 - 85/86 - -
P133 278/273 - 140/145 - -
P2-266 120/119 - 65/65 - -
P2-350 93/90 21/未 50/51 146 409
K6-266@66*4.5 109/106 - 75/76 219 583
P2-300 108/106 - - - -
K6-2/300@300 106/104 - 73/76 - -
K6-2/300@3DNow!最適化前 34 17 26 - -
K6-2/300@3DNow!レジスタ最適化 26 - - - 146

     @@。
by __O゜___Kazu 全充