VectorUtility_8h_source.html

// Copyright Epic Games, Inc. All Rights Reserved.

#pragma once


#include "Math/VectorRegister.h"

#include "Chaos/Core.h"


template<typename T>

T TVectorZero();


template<>


inline VectorRegister4Float TVectorZero<VectorRegister4Float>()

{

    return VectorZeroFloat();

}


template<>


inline VectorRegister4Double TVectorZero<VectorRegister4Double>()

{

    return VectorZeroDouble();

}


template<typename T>

T TMakeVectorRegister(float X, float Y, float Z, float W);


template<>


inline VectorRegister4Float TMakeVectorRegister<VectorRegister4Float>(float X, float Y, float Z, float W)

{

    return MakeVectorRegisterFloat(X, Y, Z, W);

}


template<>


inline VectorRegister4Double TMakeVectorRegister<VectorRegister4Double>(float X, float Y, float Z, float W)

{

    return MakeVectorRegisterDouble(X, Y, Z, W);

}


template<typename T>

constexpr T TMakeVectorRegisterConstant(float X, float Y, float Z, float W);


template<>


constexpr VectorRegister4Float TMakeVectorRegisterConstant<VectorRegister4Float>(float X, float Y, float Z, float W)

{

    return MakeVectorRegisterFloatConstant(X, Y, Z, W);

}


template<>


constexpr VectorRegister4Double TMakeVectorRegisterConstant<VectorRegister4Double>(float X, float Y, float Z, float W)

{

    return MakeVectorRegisterDoubleConstant(X, Y, Z, W);

}


template<typename T>

VectorRegister4Float TMakeVectorRegisterFloatFromDouble(const T& V);


template<>


inline VectorRegister4Float TMakeVectorRegisterFloatFromDouble<VectorRegister4Double>(const VectorRegister4Double& V)

{

    return MakeVectorRegisterFloatFromDouble(V);

}


// Should generate no op

template<>


constexpr VectorRegister4Float TMakeVectorRegisterFloatFromDouble<VectorRegister4Float>(const VectorRegister4Float& V)

{

    return V;

}


FORCEINLINE VectorRegister4Float VectorCast4IntTo4Float(const VectorRegister4Int& V)

{

#if (!defined(_MSC_VER) || PLATFORM_ENABLE_VECTORINTRINSICS_NEON) && PLATFORM_ENABLE_VECTORINTRINSICS

    return VectorRegister4Float(V);

#elif PLATFORM_ENABLE_VECTORINTRINSICS

    return _mm_castsi128_ps(V);

#else

    return VectorCastIntToFloat(Vec);

#endif

}


FORCEINLINE VectorRegister4Int VectorCast4FloatTo4Int(const VectorRegister4Float& V)

{

#if (!defined(_MSC_VER) || PLATFORM_ENABLE_VECTORINTRINSICS_NEON) && PLATFORM_ENABLE_VECTORINTRINSICS

    return VectorRegister4Int(V);

#elif PLATFORM_ENABLE_VECTORINTRINSICS

    return _mm_castps_si128(V);

#else

    return VectorCastFloatToInt(Vec);

#endif


}


FORCEINLINE VectorRegister4Float VectorUnpackLo(const VectorRegister4Float& A, const VectorRegister4Float& B)

{

#if PLATFORM_ENABLE_VECTORINTRINSICS_NEON

    return vzip1q_f32(A, B);

#elif PLATFORM_ENABLE_VECTORINTRINSICS

    return _mm_unpacklo_ps(A, B);

#else

    return MakeVectorRegisterFloat(A.V[0], B.V[0], A.V[1], B.V[1]);

#endif

}


FORCEINLINE VectorRegister4Double VectorUnpackLo(const VectorRegister4Double& A, const VectorRegister4Double& B)

{

#if PLATFORM_ENABLE_VECTORINTRINSICS_NEON

    VectorRegister4Double Result;

    Result.XY = vzip1q_f64(A.XY, B.XY);

    Result.ZW = vzip2q_f64(A.XY, B.XY);

    return Result;

#elif PLATFORM_ENABLE_VECTORINTRINSICS

    #if UE_PLATFORM_MATH_USE_AVX

        return _mm256_permute2f128_pd(_mm256_unpackhi_pd(A, B), _mm256_unpacklo_pd(A, B), 0x02);

    #else

    VectorRegister4Double Result;

    Result.XY = _mm_unpacklo_pd(A.XY, B.XY);

    Result.ZW = _mm_unpackhi_pd(A.XY, B.XY);

    return Result;

    #endif

#else

    return MakeVectorRegisterFloat(A.V[0], B.V[0], A.V[1], B.V[1]);

#endif

}


FORCEINLINE VectorRegister4Float VectorUnpackHi(const VectorRegister4Float& A, const VectorRegister4Float& B)

{

#if PLATFORM_ENABLE_VECTORINTRINSICS_NEON

    return vzip2q_f32(A, B);

#elif PLATFORM_ENABLE_VECTORINTRINSICS

    return _mm_unpackhi_ps(A, B);

#else

    return MakeVectorRegisterFloat(A.V[2], B.V[2], A.V[3], B.V[3]);

#endif

}


FORCEINLINE VectorRegister4Float VectorMoveLh(const VectorRegister4Float& A, const VectorRegister4Float& B)

{

#if PLATFORM_ENABLE_VECTORINTRINSICS_NEON

    return vzip1q_f64(A, B);

#else

    return VectorCombineLow(A, B);

#endif

}


namespace Chaos::Private

{


    FORCEINLINE VectorRegister4Float VectorDot3FastX(const VectorRegister4Float& Vec1, const VectorRegister4Float& Vec2)

    {

#if PLATFORM_ENABLE_VECTORINTRINSICS_NEON

        VectorRegister4Float Temp = VectorMultiply(Vec1, Vec2); // Multiply 2 vector

        float32x2_t sum = vpadd_f32(vget_low_f32(Temp), vget_high_f32(Temp));

        sum = vpadd_f32(sum, sum);

        return vcombine_f32(sum, sum);

#elif PLATFORM_ENABLE_VECTORINTRINSICS

        return _mm_dp_ps(Vec1, Vec2, 0xFF);

#else

        return VectorDot3(Vec1, Vec2);

#endif

    }


    FORCEINLINE VectorRegister4Float VectorMatrixMultiply(const VectorRegister4Float& Vec, const FMatrix33& M)

    {

        const VectorRegister4Float VecX = VectorReplicate(Vec, 0);

        const VectorRegister4Float VecY = VectorReplicate(Vec, 1);

        const VectorRegister4Float VecZ = VectorReplicate(Vec, 2);


        const VectorRegister4Float R0 = MakeVectorRegisterFloatFromDouble(MakeVectorRegister(M.M[0][0], M.M[0][1], M.M[0][2], 0.0));

        const VectorRegister4Float R1 = MakeVectorRegisterFloatFromDouble(MakeVectorRegister(M.M[1][0], M.M[1][1], M.M[1][2], 0.0));

        const VectorRegister4Float R2 = MakeVectorRegisterFloatFromDouble(MakeVectorRegister(M.M[2][0], M.M[2][1], M.M[2][2], 0.0));

        return VectorMultiplyAdd(R0, VecX, VectorMultiplyAdd(R1, VecY, VectorMultiply(R2, VecZ)));

    }


    FORCEINLINE VectorRegister4Float VectorCrossNoFMA(const VectorRegister4Float& Vec1, const VectorRegister4Float& Vec2)

    {

#if PLATFORM_ENABLE_VECTORINTRINSICS

        // YZX

        VectorRegister4Float A = VectorSwizzle(Vec2, 1, 2, 0, 3);

        VectorRegister4Float B = VectorSwizzle(Vec1, 1, 2, 0, 3);

        // XY, YZ, ZX

        // This is the only way found to avoid the compiler on XSX using FMA.

        // By forcing two FMA in a row, the subtract cannot be a FMA at the end.

        // This allow to have a symmetric and reliable cross product.

        A = VectorMultiplyAdd(A, Vec1, VectorZero());

        B = VectorMultiplyAdd(B, Vec2, VectorZero());

        // XY-YX, YZ-ZY, ZX-XZ

        A = VectorSubtract(A, B);

        // YZ-ZY, ZX-XZ, XY-YX

        return VectorSwizzle(A, 1, 2, 0, 3);

#else

        return VectorCross(Vec1, Vec2);

#endif

    }


    FORCEINLINE VectorRegister4Double VectorCrossNoFMA(const VectorRegister4Double& Vec1, const VectorRegister4Double& Vec2)

    {

#if PLATFORM_ENABLE_VECTORINTRINSICS_NEON

        VectorRegister4Double C = VectorMultiply(Vec1, VectorSwizzle(Vec2, 1, 2, 0, 3));

        C = VectorSubtract(C, VectorMultiply(VectorSwizzle(Vec1, 1, 2, 0, 3), Vec2));

        return VectorSwizzle(C, 1, 2, 0, 3);

#elif PLATFORM_ENABLE_VECTORINTRINSICS

        // YZX

        VectorRegister4Double A = VectorSwizzle(Vec2, 1, 2, 0, 3);

        VectorRegister4Double B = VectorSwizzle(Vec1, 1, 2, 0, 3);

        // XY, YZ, ZX

        A = VectorMultiply(A, Vec1);

        // XY-YX, YZ-ZY, ZX-XZ

        A = VectorSubtract(A, VectorMultiply(B, Vec2));

        // YZ-ZY, ZX-XZ, XY-YX

        return VectorSwizzle(A, 1, 2, 0, 3);

#else

        return VectorCross(Vec1, Vec2);

#endif

    }


}


FORCEINLINE VectorRegister4Float VectorBitwiseNotAnd(const VectorRegister4Float& A, const VectorRegister4Float& B)

{

#if PLATFORM_ENABLE_VECTORINTRINSICS_NEON

    return (VectorRegister4Float)vandq_u32(vmvnq_u32((VectorRegister4Int)A), (VectorRegister4Int)B);

#elif PLATFORM_ENABLE_VECTORINTRINSICS

    return _mm_andnot_ps(A, B);

#else

    return MakeVectorRegisterFloat(

        uint32(~((uint32*)(A.V))[0] & ((uint32*)(B.V))[0]),

        uint32(~((uint32*)(A.V))[1] & ((uint32*)(B.V))[1]),

        uint32(~((uint32*)(A.V))[2] & ((uint32*)(B.V))[2]),

        uint32(~((uint32*)(A.V))[3] & ((uint32*)(B.V))[3]));

#endif

}


FORCEINLINE VectorRegister4Double VectorBitwiseNotAnd(const VectorRegister4Double& A, const VectorRegister4Double& B)

{

    VectorRegister4Double Result;

#if PLATFORM_ENABLE_VECTORINTRINSICS_NEON

    Result.XY = (VectorRegister2Double)vandq_u32(vmvnq_u32((VectorRegister2Double)A.XY), (VectorRegister2Double)B.XY);

    Result.ZW = (VectorRegister2Double)vandq_u32(vmvnq_u32((VectorRegister2Double)A.ZW), (VectorRegister2Double)B.ZW);

#elif PLATFORM_ENABLE_VECTORINTRINSICS

#if !UE_PLATFORM_MATH_USE_AVX

    Result.XY = _mm_cvtps_pd(_mm_andnot_ps(_mm_cvtpd_ps(A.XY), _mm_cvtpd_ps(B.XY)));

    Result.ZW = _mm_cvtps_pd(_mm_andnot_ps(_mm_cvtpd_ps(A.ZW), _mm_cvtpd_ps(B.ZW)));

#else

    Result = _mm256_andnot_pd(A, B);

#endif

#else

    Result = MakeVectorRegisterDouble(

        uint64(~((uint64*)(A.V))[0] & ((uint64*)(B.V))[0]),

        uint64(~((uint64*)(A.V))[1] & ((uint64*)(B.V))[1]),

        uint64(~((uint64*)(A.V))[2] & ((uint64*)(B.V))[2]),

        uint64(~((uint64*)(A.V))[3] & ((uint64*)(B.V))[3]));

#endif

    return Result;

}


FORCEINLINE
#define FORCEINLINE
Definition AndroidPlatform.h:140

ESplineBoneAxis::Z
@ Z

ESplineBoneAxis::Y
@ Y

EMusicalNoteName::C
@ C

EMusicalNoteName::A
@ A

EMusicalNoteName::B
@ B

uint64
FPlatformTypes::uint64 uint64
A 64-bit unsigned integer.
Definition Platform.h:1117

StaticCastSharedRef
UE_FORCEINLINE_HINT TSharedRef< CastToType, Mode > StaticCastSharedRef(TSharedRef< CastFromType, Mode > const &InSharedRef)
Definition SharedPointer.h:127

Core.h

X
#define X(Name, Desc)
Definition FormatStringSan.h:47

VectorSubtract
FORCEINLINE VectorRegister4Float VectorSubtract(const VectorRegister4Float &Vec1, const VectorRegister4Float &Vec2)
Definition UnrealMathFPU.h:731

VectorCastFloatToInt
#define VectorCastFloatToInt(Vec)
Definition UnrealMathFPU.h:2654

VectorDot3
FORCEINLINE VectorRegister4Float VectorDot3(const VectorRegister4Float &Vec1, const VectorRegister4Float &Vec2)
Definition UnrealMathFPU.h:880

MakeVectorRegister
FORCEINLINE VectorRegister4Float MakeVectorRegister(uint32 X, uint32 Y, uint32 Z, uint32 W)
Definition UnrealMathFPU.h:195

VectorZeroDouble
FORCEINLINE VectorRegister4Double VectorZeroDouble(void)
Definition UnrealMathFPU.h:336

VectorMultiply
FORCEINLINE VectorRegister4Float VectorMultiply(const VectorRegister4Float &Vec1, const VectorRegister4Float &Vec2)
Definition UnrealMathFPU.h:758

MakeVectorRegisterFloatConstant
FORCEINLINE constexpr VectorRegister4Float MakeVectorRegisterFloatConstant(float X, float Y, float Z, float W)
Definition UnrealMathFPU.h:297

VectorCombineLow
FORCEINLINE VectorRegister4Float VectorCombineLow(const VectorRegister4Float &Vec1, const VectorRegister4Float &Vec2)
Definition UnrealMathFPU.h:1757

VectorMultiplyAdd
FORCEINLINE VectorRegister4Float VectorMultiplyAdd(const VectorRegister4Float &Vec1, const VectorRegister4Float &Vec2, const VectorRegister4Float &Vec3)
Definition UnrealMathFPU.h:786

VectorCastIntToFloat
#define VectorCastIntToFloat(Vec)
Definition UnrealMathFPU.h:2653

MakeVectorRegisterDouble
FORCEINLINE VectorRegister4Double MakeVectorRegisterDouble(uint64 X, uint64 Y, uint64 Z, uint64 W)
Definition UnrealMathFPU.h:185

VectorSwizzle
#define VectorSwizzle(Vec, X, Y, Z, W)
Definition UnrealMathFPU.h:639

VectorZeroFloat
FORCEINLINE VectorRegister4Float VectorZeroFloat(void)
Definition UnrealMathFPU.h:331

VectorCross
FORCEINLINE VectorRegister4Float VectorCross(const VectorRegister4Float &Vec1, const VectorRegister4Float &Vec2)
Definition UnrealMathFPU.h:1216

MakeVectorRegisterFloat
FORCEINLINE VectorRegister4Float MakeVectorRegisterFloat(uint32 X, uint32 Y, uint32 Z, uint32 W)
Definition UnrealMathFPU.h:175

MakeVectorRegisterFloatFromDouble
FORCEINLINE VectorRegister4Float MakeVectorRegisterFloatFromDouble(const VectorRegister4Double &Vec4d)
Definition UnrealMathFPU.h:262

VectorReplicate
#define VectorReplicate(Vec, ElementIndex)
Definition UnrealMathFPU.h:627

VectorZero
FORCEINLINE VectorRegister4Float VectorZero(void)
Definition UnrealMathVectorCommon.h.inl:16

MakeVectorRegisterDoubleConstant
FORCEINLINE constexpr VectorRegister4Double MakeVectorRegisterDoubleConstant(VectorRegister2Double XY, VectorRegister2Double ZW)
Definition UnrealMathVectorConstants.h.inl:17

VectorRegister.h

TVectorZero< VectorRegister4Double >
VectorRegister4Double TVectorZero< VectorRegister4Double >()
Definition VectorUtility.h:18

VectorCast4FloatTo4Int
FORCEINLINE VectorRegister4Int VectorCast4FloatTo4Int(const VectorRegister4Float &V)
Definition VectorUtility.h:93

TMakeVectorRegisterConstant< VectorRegister4Float >
constexpr VectorRegister4Float TMakeVectorRegisterConstant< VectorRegister4Float >(float X, float Y, float Z, float W)
Definition VectorUtility.h:42

TMakeVectorRegisterConstant< VectorRegister4Double >
constexpr VectorRegister4Double TMakeVectorRegisterConstant< VectorRegister4Double >(float X, float Y, float Z, float W)
Definition VectorUtility.h:48

TMakeVectorRegister< VectorRegister4Float >
VectorRegister4Float TMakeVectorRegister< VectorRegister4Float >(float X, float Y, float Z, float W)
Definition VectorUtility.h:27

VectorBitwiseNotAnd
FORCEINLINE VectorRegister4Float VectorBitwiseNotAnd(const VectorRegister4Float &A, const VectorRegister4Float &B)
Definition VectorUtility.h:289

TMakeVectorRegisterFloatFromDouble
VectorRegister4Float TMakeVectorRegisterFloatFromDouble(const T &V)

TMakeVectorRegisterConstant
constexpr T TMakeVectorRegisterConstant(float X, float Y, float Z, float W)

TVectorZero< VectorRegister4Float >
VectorRegister4Float TVectorZero< VectorRegister4Float >()
Definition VectorUtility.h:12

TVectorZero
T TVectorZero()

TMakeVectorRegister< VectorRegister4Double >
VectorRegister4Double TMakeVectorRegister< VectorRegister4Double >(float X, float Y, float Z, float W)
Definition VectorUtility.h:33

VectorUnpackHi
FORCEINLINE VectorRegister4Float VectorUnpackHi(const VectorRegister4Float &A, const VectorRegister4Float &B)
Definition VectorUtility.h:159

VectorCast4IntTo4Float
FORCEINLINE VectorRegister4Float VectorCast4IntTo4Float(const VectorRegister4Int &V)
Definition VectorUtility.h:75

TMakeVectorRegisterFloatFromDouble< VectorRegister4Float >
constexpr VectorRegister4Float TMakeVectorRegisterFloatFromDouble< VectorRegister4Float >(const VectorRegister4Float &V)
Definition VectorUtility.h:64

VectorMoveLh
FORCEINLINE VectorRegister4Float VectorMoveLh(const VectorRegister4Float &A, const VectorRegister4Float &B)
Definition VectorUtility.h:177

TMakeVectorRegisterFloatFromDouble< VectorRegister4Double >
VectorRegister4Float TMakeVectorRegisterFloatFromDouble< VectorRegister4Double >(const VectorRegister4Double &V)
Definition VectorUtility.h:57

VectorUnpackLo
FORCEINLINE VectorRegister4Float VectorUnpackLo(const VectorRegister4Float &A, const VectorRegister4Float &B)
Definition VectorUtility.h:112

TMakeVectorRegister
T TMakeVectorRegister(float X, float Y, float Z, float W)

uint32
uint32_t uint32
Definition binka_ue_file_header.h:6

Chaos::PMatrix< FReal, 3, 3 >

Chaos::Private
Definition BodyInstance.h:90

Chaos::Private::VectorMatrixMultiply
FORCEINLINE VectorRegister4Float VectorMatrixMultiply(const VectorRegister4Float &Vec, const FMatrix33 &M)
Definition VectorUtility.h:211

Chaos::Private::VectorDot3FastX
FORCEINLINE VectorRegister4Float VectorDot3FastX(const VectorRegister4Float &Vec1, const VectorRegister4Float &Vec2)
Definition VectorUtility.h:197

Chaos::Private::VectorCrossNoFMA
FORCEINLINE VectorRegister4Float VectorCrossNoFMA(const VectorRegister4Float &Vec1, const VectorRegister4Float &Vec2)
Definition VectorUtility.h:231

VectorRegister2Double
Definition UnrealMathFPU.h:34

VectorRegister4Double
Definition UnrealMathFPU.h:42

VectorRegister4Float
Definition UnrealMathFPU.h:20

VectorRegister4Int
Definition UnrealMathFPU.h:28