Mudbox-SDK/cpp_ref/_s_s_e_8h_source.html

 //**************************************************************************/

 // Copyright (c) 2008 Autodesk, Inc.

 // All rights reserved.

 //

 // Use of this software is subject to the terms of the Autodesk license

 // agreement provided at the time of installation or download, or which

 // otherwise accompanies this software in either electronic or hard copy form.

 //

 //**************************************************************************/

 // DESCRIPTION:

 // CREATED: October 2008

 //**************************************************************************/


 #ifndef __MUDBOXSDK_SSE_H__

 #define __MUDBOXSDK_SSE_H__


 #if defined(JAMBUILD)

 #include <Mudbox/mudbox.h>

 #else

 #include "mudbox.h"

 #endif


 #if defined(__GNUC__)


 #ifndef __SSE3__

 #error This file was intended to compiled with SSE3 instruction set enabled.

 #endif


 //

 // If you are using GCC instead of the Intel C Compiler, don't forget

 // to specify -I/usr/lib/gcc/i686-apple-darwin9/4.0.1/include when compiling

 // a file that use this header.

 //

 #include <xmmintrin.h>

 #include <pmmintrin.h>

 #endif


 #if defined(WIN32) || defined(WIN64)

 #include <xmmintrin.h>

 #include <intrin.h>

 #endif


 #ifndef MB_SSE_ALIGN16_VAR


 #if defined(_MSC_VER)

 #define MB_SSE_ALIGN16_VAR(v) __declspec(align(16)) v

 #define MB_SSE_ALIGN16_CLASS  __declspec(align(16))

 #ifndef __attribute__

 #define __attribute__(_a)

 #endif

 #elif defined(__GNUC__)

 #define MB_SSE_ALIGN16_VAR(v) v __attribute__ ((aligned(16)))

 #define MB_SSE_ALIGN16_CLASS  __attribute__ ((aligned(16)))

 #ifndef __forceinline

 #define __forceinline inline

 #endif

 #else

 #error The MB_SSE_ALIGN16_VAR needs to be ported for this compiler.

 #endif


 #endif


 struct MBDLL_DECL HWVector

 {

     inline HWVector( void ) __attribute__((always_inline)){};


     inline void setZero( void ) __attribute__((always_inline))

     {

         v = _mm_setzero_ps();

     }


     inline HWVector( float f ) __attribute__((always_inline))

     {

         v = _mm_set_ps1( f );

     }


     inline HWVector( const mudbox::Vector &h ) __attribute__((always_inline))

     {

         v = _mm_set_ps( h.x, h.y, h.z, 0);

     };

     inline HWVector( float x, float y, float z, float w = 0 ) __attribute__((always_inline))

     {

         v = _mm_set_ps( x,y,z,w );

     };

     void Fill( const mudbox::Vector &vVector );

     inline HWVector( const float a[4] ) __attribute__((always_inline))

     {

         v = _mm_loadu_ps( a );

     };

     inline HWVector ShiftLeft( void ) const    __attribute__((always_inline)){ HWVector r; r.v = _mm_shuffle_ps(v,v,_MM_SHUFFLE(2,1,3,0)); return r; };

     inline void ShiftLeft(HWVector &result)    __attribute__((always_inline)){ result.v = _mm_shuffle_ps(v,v,_MM_SHUFFLE(2,1,3,0)); }

     inline void ShiftLeftInPlace()             __attribute__((always_inline)){ v = _mm_shuffle_ps(v,v,_MM_SHUFFLE(2,1,3,0)); }

     inline HWVector ShiftRight( void ) const   __attribute__((always_inline)){ HWVector r; r.v = _mm_shuffle_ps(v,v,_MM_SHUFFLE(1,3,2,0)); return r; };

     inline void ShiftRight( HWVector &result ) __attribute__((always_inline)){ result.v = _mm_shuffle_ps(v,v,_MM_SHUFFLE(1,3,2,0)); };

     inline HWVector operator &(  HWVector &o ) __attribute__((always_inline))

     {

         //HWVector al = (*this).ShiftLeft(), bl = o.ShiftLeft(), ar = (*this).ShiftRight(), br = o.ShiftRight();

         HWVector al, bl, ar, br;

         ShiftLeft(al);

         o.ShiftLeft(bl);

         ShiftRight(ar);

         o.ShiftRight(br);


         return al*br-ar*bl;

     };


     inline HWVector operator |( const HWVector &o ) const __attribute__((always_inline))

     {

         HWVector r;

         r.v = _mm_mul_ps( v, o.v );

         // Requires SSE3

         r.v = _mm_hadd_ps( r.v, r.v );

         r.v = _mm_hadd_ps( r.v, r.v );

         return r;

     };


     inline HWVector Length( void ) const __attribute__((always_inline))

     {

         HWVector r = operator |( *this );

         r.v = _mm_sqrt_ss( r.v );

         return r;

     };


     inline HWVector LengthSquared( void ) const __attribute__((always_inline))

     {

         HWVector r = operator |( *this );

         return r;

     };


     inline float DistanceFromLine( const HWVector &vStart,const HWVector &vEnd ) const __attribute__((always_inline))

     {

         HWVector n = vEnd - vStart;

         HWVector m = (*this)-vStart;

         HWVector h = n&m;

         HWVector d = n&h;

         d.Normalize();

         float fDistance = (d|(*this))-(d|vStart);

         return fDistance>0?fDistance:(-fDistance);

     }


     inline void Normalize( void ) __attribute__((always_inline))

     {

         HWVector f = operator |( *this );

         f.v = _mm_rsqrt_ps( f.v );

         v = _mm_mul_ps( f.v, v );

     };


     inline HWVector Floor( void ) __attribute__((always_inline))

     {

         static const unsigned int a        = (1 << 23);

         static const float  twoTo23AsFloat = (float)a;

         static const __m128 twoTo23 = _mm_set_ps( twoTo23AsFloat, twoTo23AsFloat, twoTo23AsFloat, twoTo23AsFloat );

         // b = fabs(v)

         __m128 b = _mm_castsi128_ps(_mm_srli_epi32( _mm_slli_epi32( _mm_castps_si128(v),1 ), 1 ));

         // The essence of the floor routine

         __m128 d = _mm_sub_ps( _mm_add_ps( _mm_add_ps( _mm_sub_ps( v, twoTo23 ), twoTo23 ), twoTo23 ), twoTo23 );

         // set mask to all 1s if v >= 2**23

         __m128 largeMaskE = _mm_cmpgt_ps( b, twoTo23 );

         // Check for possible off by one error

         __m128 g = _mm_cmplt_ps( v, d );

         // Convert positive check result to -1.0, negative to 0.0

         __m128 h = _mm_cvtepi32_ps( _mm_castps_si128(g) );

         // Add in the error if there is one

         __m128 t = _mm_add_ps( d, h );

         // Select between output result and input value based on v >= 2**23

         __m128 w = _mm_and_ps( v, largeMaskE );

         t = _mm_andnot_ps( largeMaskE, t );

         HWVector vResult;

         vResult.v = _mm_or_ps( t, w );

         return vResult;

     };


     inline HWVector Minimum( const HWVector &o ) const    __attribute__((always_inline)){ HWVector r; r.v = _mm_min_ps( v, o.v ); return r; };

     inline HWVector Maximum( const HWVector &o ) const    __attribute__((always_inline)){ HWVector r; r.v = _mm_max_ps( v, o.v ); return r; };

     inline HWVector operator +( const HWVector &o ) const __attribute__((always_inline)){ HWVector r; r.v = _mm_add_ps( v, o.v ); return r; };

     inline HWVector operator -( const HWVector &o ) const __attribute__((always_inline)){ HWVector r; r.v = _mm_sub_ps( v, o.v ); return r; };

     inline void operator +=( const HWVector &o ) __attribute__((always_inline)){ v = _mm_add_ps( v, o.v ); };

     inline void operator -=( const HWVector &o ) __attribute__((always_inline)){ v = _mm_sub_ps( v, o.v ); };

     inline void operator *=( const HWVector &o ) __attribute__((always_inline)){ v = _mm_mul_ps( v, o.v ); };

     inline void operator /=( const HWVector &o ) __attribute__((always_inline)){ v = _mm_div_ps( v, o.v ); };

     inline HWVector operator *( const HWVector &o ) const __attribute__((always_inline)){ HWVector r; r.v = _mm_mul_ps( v, o.v ); return r; };

     inline HWVector operator *( float f ) const __attribute__((always_inline)){ HWVector r; r.v = _mm_mul_ps( v, _mm_set1_ps( f ) ); return r; };

     inline HWVector operator /( const HWVector &o ) const __attribute__((always_inline)){ HWVector r; r.v = _mm_div_ps( v, o.v ); return r; };

     inline void operator *=( float f )  __attribute__((always_inline)){ v = _mm_mul_ps( v, _mm_set1_ps(f ) ); };

     inline void Store( float *p ) __attribute__((always_inline)){ _mm_storeu_ps( p, v ); };

     inline void Load( float f ) __attribute__((always_inline))  { v = _mm_set_ps1( f ); };

     inline void StoreNormalAsInt( int *pBuffer ) const __attribute__((always_inline))

     {

         //static __declspec(align(16)) float c[4] = { 32766.0f, 32766.0f, 32766.0f, 32766.0f };

         // instead of the correct value, we use a little bit smaller number, because after

         // normalization a component can be a littlebit bigger than 1.0. in that case storing it in

         // a 16 bit integer would overflow, and artifacts on the surface would appear.

         static const MB_SSE_ALIGN16_VAR(float c[4]) = { 32740.0f, 32740.0f, 32740.0f, 32740.0f };


         __m128 f = _mm_load_ps( c );

         f = _mm_mul_ps( f, v );

         __m128i i = _mm_cvtps_epi32( f );

         _mm_storeu_si128( (__m128i *)pBuffer, i );

     };

     inline void StoreAsInt( int *pBuffer ) const __attribute__((always_inline))

     {

         __m128i i = _mm_cvtps_epi32( v );

         _mm_storeu_si128( (__m128i *)pBuffer, i );

     };

     inline void StoreAsIntTruncate( int *pBuffer ) const __attribute__((always_inline))

     {

         __m128i i = _mm_cvttps_epi32( v );

         _mm_storeu_si128( (__m128i *)pBuffer, i );

     };

     inline operator float( void ) const __attribute__((always_inline))

     {

         MB_SSE_ALIGN16_VAR(float f);

         _mm_store_ss( &f, v );

         return f;

     };

     inline operator mudbox::Vector( void ) const __attribute__((always_inline))

     {

         mudbox::Vector r;

         __m128 t = _mm_shuffle_ps( v, v, _MM_SHUFFLE(2,1,0,3) );

         _mm_store_ss( &r.x, t );

         t = _mm_shuffle_ps( t, t, _MM_SHUFFLE(2,1,0,3) );

         _mm_store_ss( &r.y, t );

         t = _mm_shuffle_ps( t, t, _MM_SHUFFLE(2,1,0,3) );

         _mm_store_ss( &r.z, t );

         return r;

     };

     inline operator mudbox::Vector4( void ) const __attribute__((always_inline))

     {

         mudbox::Vector4 r;

         __m128 t = _mm_shuffle_ps( v, v, _MM_SHUFFLE(2,1,0,3) );

         _mm_store_ss( &r.x, t );

         t = _mm_shuffle_ps( t, t, _MM_SHUFFLE(2,1,0,3) );

         _mm_store_ss( &r.y, t );

         t = _mm_shuffle_ps( t, t, _MM_SHUFFLE(2,1,0,3) );

         _mm_store_ss( &r.z, t );

         t = _mm_shuffle_ps( t, t, _MM_SHUFFLE(2,1,0,3) );

         _mm_store_ss( &r.w, t );

         return r;

     };


     MB_SSE_ALIGN16_VAR(__m128 v);

 };


 inline mudbox::Vector &operator <<( mudbox::Vector &v, const HWVector &r )

 {

     __m128 t = _mm_shuffle_ps( r.v, r.v, _MM_SHUFFLE(2,1,0,3) );

     _mm_store_ss( &v.x, t );

     t = _mm_shuffle_ps( t, t, _MM_SHUFFLE(2,1,0,3) );

     _mm_store_ss( &v.y, t );

     t = _mm_shuffle_ps( t, t, _MM_SHUFFLE(2,1,0,3) );

     _mm_store_ss( &v.z, t );

     return v;


     //__m128 t = _mm_shuffle_ps( r.v, r.v, _MM_SHUFFLE(0,1,2,3) );

     //int a = ((int *)&v)[3];

     //_mm_storeu_ps( &v.x, t );

     //((int *)&v)[3] = a;

     //return v;

 };


 struct HWMatrix

 {

     inline HWMatrix( void )  __attribute__((always_inline)){};

     inline HWMatrix( const mudbox::Matrix &m ) __attribute__((always_inline))

     {

         r0 = _mm_loadu_ps( &m._11 );

         r1 = _mm_loadu_ps( &m._21 );

         r2 = _mm_loadu_ps( &m._31 );

         r3 = _mm_loadu_ps( &m._41 );

     };

     void MirrorX( void ) __attribute__((always_inline))

     {

         r0 = _mm_shuffle_ps( r0, r0, _MM_SHUFFLE(0, 1, 2, 3) );

         r1 = _mm_shuffle_ps( r1, r1, _MM_SHUFFLE(0, 1, 2, 3) );

         r2 = _mm_shuffle_ps( r2, r2, _MM_SHUFFLE(0, 1, 2, 3) );

         r3 = _mm_shuffle_ps( r3, r3, _MM_SHUFFLE(0, 1, 2, 3) );

     };

     inline HWVector Transform( const HWVector &v, float w = 1.0f ) const __attribute__((always_inline))

     {

         // Represents v * M

         // v is a row vector.


         MB_SSE_ALIGN16_VAR(float c[4]) = { w, w, w, w };


         __m128 v0 = _mm_shuffle_ps( v.v, v.v, _MM_SHUFFLE(3,3,3,3) );

         __m128 v1 = _mm_shuffle_ps( v.v, v.v, _MM_SHUFFLE(2,2,2,2) );

         __m128 v2 = _mm_shuffle_ps( v.v, v.v, _MM_SHUFFLE(1,1,1,1) );

         __m128 v3 = _mm_load_ps( c );


         __m128 a0 = _mm_mul_ps( v0, r0 );

         __m128 a1 = _mm_mul_ps( v1, r1 );

         __m128 a2 = _mm_mul_ps( v2, r2 );

         __m128 a3 = _mm_mul_ps( v3, r3 );


         __m128 r = _mm_add_ps( a0, _mm_add_ps( a1, _mm_add_ps( a2, a3 ) ) );


         HWVector z;

         z.v = r;

         return z;

     };

     inline HWVector ProjectedTransform( const HWVector &v ) const __attribute__((always_inline))

     {

         static MB_SSE_ALIGN16_VAR(float c[4]) = { 1, 1, 1, 1 };


         __m128 v0 = _mm_shuffle_ps( v.v, v.v, _MM_SHUFFLE(3,3,3,3) );

         __m128 v1 = _mm_shuffle_ps( v.v, v.v, _MM_SHUFFLE(2,2,2,2) );

         __m128 v2 = _mm_shuffle_ps( v.v, v.v, _MM_SHUFFLE(1,1,1,1) );

         __m128 v3 = _mm_load_ps( c );


         __m128 a0 = _mm_mul_ps( v0, r0 );

         __m128 a1 = _mm_mul_ps( v1, r1 );

         __m128 a2 = _mm_mul_ps( v2, r2 );

         __m128 a3 = _mm_mul_ps( v3, r3 );


         __m128 r = _mm_add_ps( a0, _mm_add_ps( a1, _mm_add_ps( a2, a3 ) ) );

         __m128 d = _mm_shuffle_ps( r, r, _MM_SHUFFLE(3,3,3,3) );


         HWVector z;

         z.v = _mm_div_ps( r, d );

         return z;

     };


     MB_SSE_ALIGN16_VAR(__m128 r0);

     MB_SSE_ALIGN16_VAR(__m128 r1);

     MB_SSE_ALIGN16_VAR(__m128 r2);

     MB_SSE_ALIGN16_VAR(__m128 r3);

 };


 //-----------------------------------------------------------------------------

 bool MBDLL_DECL hasSSE3();


 bool MBDLL_DECL hasSSE41();


 bool MBDLL_DECL hasSSE42();


 bool MBDLL_DECL hasAVX256();


 //-----------------------------------------------------------------------------


 #endif

HWVector::LengthSquared
HWVector LengthSquared(void) const __attribute__((always_inline))
Definition: SSE.h:125

r
GLdouble GLdouble GLdouble r
Definition: GLee.h:1189

mudbox::Vector::z
float z
Definition: math.h:340

hasAVX256
bool MBDLL_DECL hasAVX256()
Query if AVX is available. present on Sandybridge.

operator/
const QPoint operator/(const QPoint &p, qreal c)
Definition: qpoint.h:201

y
GLenum GLint GLint y
Definition: GLee.h:876

hasSSE41
bool MBDLL_DECL hasSSE41()
Query if SSE4.1 is available. Present on Penryn (later Core 2)

HWVector::HWVector
HWVector(const float a[4]) __attribute__((always_inline))
Definition: SSE.h:87

mudbox::Vector
Represents a 3D vector or point with S23E8 floating point elements.
Definition: math.h:35

HWVector::Floor
HWVector Floor(void) __attribute__((always_inline))
Definition: SSE.h:149

z
GLdouble GLdouble z
Definition: GLee.h:1393

HWVector
This class represents a four dimensional vector stored in the SSE registers.
Definition: SSE.h:64

operator+=
QByteArray & operator+=(QByteArray &a, const QStringBuilder< A, B > &b)
Definition: qstringbuilder.h:427

mudbox::Vector4::z
float z
Definition: math.h:632

HWVector::Length
HWVector Length(void) const __attribute__((always_inline))
Definition: SSE.h:118

v2
GLfloat GLfloat GLfloat v2
Definition: GLee.h:1736

HWMatrix::HWMatrix
HWMatrix(void) __attribute__((always_inline))
Definition: SSE.h:267

HWVector::Minimum
HWVector Minimum(const HWVector &o) const __attribute__((always_inline))
Definition: SSE.h:174

operator<<
mudbox::Vector & operator<<(mudbox::Vector &v, const HWVector &r)
Definition: SSE.h:245

HWVector::HWVector
HWVector(float x, float y, float z, float w=0) __attribute__((always_inline))
Definition: SSE.h:82

mudbox::Vector4::y
float y
Definition: math.h:632

HWMatrix
This class represents a four by four matrix stored in the SSE registers.
Definition: SSE.h:265

mudbox.h

operator&
Q_CORE_EXPORT QBitArray operator&(const QBitArray &, const QBitArray &)

mudbox::Vector::y
float y
Definition: math.h:340

HWVector::DistanceFromLine
float DistanceFromLine(const HWVector &vStart, const HWVector &vEnd) const __attribute__((always_inline))
Definition: SSE.h:131

hasSSE42
bool MBDLL_DECL hasSSE42()
Query if SSE4.2 is available. Present on Nehalem (Core i5, Corei7)

v1
GLfloat GLfloat v1
Definition: GLee.h:1735

g
GLubyte g
Definition: GLee.h:5404

mudbox::Vector4::w
float w
Definition: math.h:632

mudbox::Matrix
This class represents a 4x4 transformation matrix.
Definition: math.h:1122

HWVector::ShiftLeft
HWVector ShiftLeft(void) const __attribute__((always_inline))
Definition: SSE.h:91

HWVector::HWVector
HWVector(void) __attribute__((always_inline))
Definition: SSE.h:66

hasSSE3
bool MBDLL_DECL hasSSE3()
Query if SSE3 is available. Present on Prescott, Core2 and later.

HWVector::ShiftRight
void ShiftRight(HWVector &result) __attribute__((always_inline))
Definition: SSE.h:95

x
GLenum GLint x
Definition: GLee.h:876

mudbox::Vector4
A four dimensionsional vector (X, Y, Z, and W)
Definition: math.h:617

operator+
const QByteArray operator+(const QByteArray &a1, const QByteArray &a2)
Definition: qbytearray.h:564

v0
GLfloat v0
Definition: GLee.h:1734

n
GLenum GLsizei n
Definition: GLee.h:3432

HWVector::HWVector
HWVector(const mudbox::Vector &h) __attribute__((always_inline))
Definition: SSE.h:78

v
const GLdouble * v
Definition: GLee.h:1174

HWMatrix::ProjectedTransform
HWVector ProjectedTransform(const HWVector &v) const __attribute__((always_inline))
Definition: SSE.h:305

b
GLubyte GLubyte b
Definition: GLee.h:5404

HWVector::Normalize
void Normalize(void) __attribute__((always_inline))
Definition: SSE.h:142

HWVector::ShiftLeft
void ShiftLeft(HWVector &result) __attribute__((always_inline))
Definition: SSE.h:92

p
GLfloat GLfloat p
Definition: GLee.h:5416

mudbox::operator*
MBDLL_DECL Vector operator*(float f, const Vector &v)
Multiplies a float scalar value by a vector, the result is a vector.
Definition: math.h:575

c
const GLubyte * c
Definition: GLee.h:5419

h
int int int int int int h
Definition: GLee.h:10534

HWVector::HWVector
HWVector(float f) __attribute__((always_inline))
Definition: SSE.h:73

HWVector::Maximum
HWVector Maximum(const HWVector &o) const __attribute__((always_inline))
Definition: SSE.h:175

HWVector::setZero
void setZero(void) __attribute__((always_inline))
Definition: SSE.h:68

a
GLubyte GLubyte GLubyte a
Definition: GLee.h:5404

mudbox::Vector4::x
float x
Definition: math.h:632

HWMatrix::Transform
HWVector Transform(const HWVector &v, float w=1.0f) const __attribute__((always_inline))
Definition: SSE.h:282

operator-
const QPoint operator-(const QPoint &p1, const QPoint &p2)
Definition: qpoint.h:170

HWVector::Store
void Store(float *p) __attribute__((always_inline))
Definition: SSE.h:186

HWVector::Load
void Load(float f) __attribute__((always_inline))
Definition: SSE.h:187

HWMatrix::MirrorX
void MirrorX(void) __attribute__((always_inline))
Definition: SSE.h:275

HWMatrix::MB_SSE_ALIGN16_VAR
MB_SSE_ALIGN16_VAR(__m128 r0)

HWVector::StoreAsIntTruncate
void StoreAsIntTruncate(int *pBuffer) const __attribute__((always_inline))
Definition: SSE.h:206

operator|
Q_CORE_EXPORT QBitArray operator|(const QBitArray &, const QBitArray &)

w
GLubyte GLubyte GLubyte GLubyte w
Definition: GLee.h:1775

HWVector::ShiftRight
HWVector ShiftRight(void) const __attribute__((always_inline))
Definition: SSE.h:94

t
GLdouble GLdouble t
Definition: GLee.h:1181

v3
GLfloat GLfloat GLfloat GLfloat v3
Definition: GLee.h:1737

mudbox::Vector::x
float x
Definition: math.h:340

f
GLclampf f
Definition: GLee.h:9303

HWVector::ShiftLeftInPlace
void ShiftLeftInPlace() __attribute__((always_inline))
Definition: SSE.h:93

MBDLL_DECL
#define MBDLL_DECL
Definition: dllinterface.h:35

HWMatrix::HWMatrix
HWMatrix(const mudbox::Matrix &m) __attribute__((always_inline))
Definition: SSE.h:268

HWVector::StoreNormalAsInt
void StoreNormalAsInt(int *pBuffer) const __attribute__((always_inline))
Definition: SSE.h:188

HWVector::StoreAsInt
void StoreAsInt(int *pBuffer) const __attribute__((always_inline))
Definition: SSE.h:201