ホーム 道しるべ 憩いの広場 濃緑空間 濃緑研の日記

普通に時間測定
ホーム ] 上へ ] [ 普通に時間測定 ] ループ展開・時間測定 ] ペアリング最適化I ] ペアリング最適化II ] x86FPUとの比較 ] 3DNow!SISDと比較 ] 配列演算総括 ]

 

#pragma warning( disable : 4799 ) // Disables EMMS warning for inline assembly

#include "amd3d.h"
#include <windows.h>
#include <math.h>
#include <stdio.h>

mtrx(float a[4], float b[4][4], float c[4])
{
    int        i;

    _asm{
        mov         edi,a             // edi = 配列a[0]のアドレス
        mov         ebx,b             // ebx = 配列b[0][0]のアドレス
        mov         ecx,c             // ecx = 配列c[0]のアドレス
    }
    for (i=0; i<4; i++) {
    _asm{
        movq    mm0,[edi]         // mm0:                 a[1]:             a[0]
        movq    mm1,[edi+8]         // mm1:                 a[3]:             a[2]
        movq    mm2,[ebx]         // mm2:             b[i]b[1]:         b[i]b[0]
        movq    mm3,[ebx+8]         // mm3:             b[i]b[3]:         b[i]b[2]
        pfmul    (m2,m0)             // mm2:     a[1]*b[i]b[1]: a[0]*b[i]b[0]
        pfmul    (m3,m1)             // mm3:     a[3]*b[i]b[3]: a[2]*b[i]b[2]
        pfadd    (m2,m3)             // mm2:
        pfacc    (m2,m2)             // mm2:     a[3]*b[i]b[3]+a[2]*b[i]b[2]+a[1]*b[i]b[1]+a[0]*b[i]b[0]
        movd    [ecx],mm2         // c[i] = mm2
        add         ebx,16             // ebx = 配列b[i+1][0]のアドレス
        add         ecx,4             // ecx = 配列c[i+1]のアドレス
        }
    }
}

main()
{
    float    a[4]={0,1,1,0};
    float     b[4][4]={{1,0,0,0},{0,0,1,0},{0,-1,0,0},{0,0,0,1}};
    float    c[4];
    char    buf[80];

long    n;
    DWORD    dt1,dt2;
    double    ddt;
   
    dt1 = GetTickCount();

    _asm{
        femms
    }
    for(n=0;n<100000000;n++)
    {
        mtrx(a,b,c);
    }
    _asm{
        femms
    }

    dt2 = GetTickCount();
    ddt = (double)(dt2-dt1)/1000.0;
    sprintf(buf,"%f %f %f %f\n3DNow!による処理時間は %.3f 秒です",c[0],c[1],c[2],c[3],ddt);
    MessageBox(GetDesktopWindow(), buf,"Test 3DNow!",MB_OK);
}