vreduceps

VREDUCEPS - REDUCE Packed Single

VREDUCEPS xmm1{k1}{z}, xmm2/m128/m32bcst, imm8 (V5+DQ+VL
__m128 _mm_reduce_ps(__m128 a, int imm8)
__m128 _mm_mask_reduce_ps(__m128 s, __mmask8 k, __m128 a, int imm8)
__m128 _mm_maskz_reduce_ps(__mmask8 k, __m128 a, int imm8)

imm8の指定に従って①の小数点以下nビットを残してその下を丸めた実数を作り
①からそれを引いた差を②にセットする

VREDUCEPS ymm1{k1}{z}, ymm2/m256/m32bcst, imm8 (V5+DQ+VL
__m256 _mm256_reduce_ps(__m256 a, int imm8)
__m256 _mm256_mask_reduce_ps(__m256 s, __mmask8 k, __m256 a, int imm8)
__m256 _mm256_maskz_reduce_ps(__mmask8 k, __m256 a, int imm8)

imm8の指定に従って①の小数点以下nビットを残してその下を丸めた実数を作り
①からそれを引いた差を②にセットする

VREDUCEPS zmm1{k1}{z}, zmm2/m512/m32bcst{sae}, imm8 (V5+DQ
__m512 _mm512_reduce_ps(__m512 a, int imm8)
__m512 _mm512_mask_reduce_ps(__m512 s, __mmask16 k, __m512 a, int imm8)
__m512 _mm512_maskz_reduce_ps(__mmask16 k, __m512 a, int imm8)
__m512 _mm512_reduce_round_ps(__m512 a, int imm8, int sae)
__m512 _mm512_mask_reduce_round_ps(__m512 s, __mmask16 k, __m512 a, int imm8, int sae)
__m512 _mm512_maskz_reduce_round_ps(__mmask16 k, __m512 a, int imm8, int sae)

imm8の指定に従って①の小数点以下nビットを残してその下を丸めた実数を作り
①からそれを引いた差を②にセットする

imm8の指定方法

bit	指定するもの
7:4	小数点以下に残すビット数を0～15で指定 0を指定すると小数点以下が0の実数にする（ROUNDPD/ROUNDPSと同様の動作）
3	0=precision例外マスクはMXCSRに従う 1=MXCSRの設定にかかわらずprecision例外をマスクする
2	0=丸め方法をビット1:0で指定する 1=丸め方法はMXCSRの設定に従う
1:0	00=近い方向に丸める　等距離のときは残すビットの最下位が0になる方向に丸める 01=マイナス無限大方向に丸める 10=プラス無限大方向に丸める 11=ゼロ方向に丸める

x86/x64 SIMD命令一覧表　フィードバック