VPCMPUW - Packed CoMPare Unsigned Word (imm8=4)

VPCMPUW k1{k2}, xmm2, xmm3/m128, 4    (V5+BW+VL
__mmask8 _mm_cmpneq_epu16_mask(__m128i a, __m128i b)
__mmask8 _mm_mask_cmpneq_epu16_mask(__mmask8 k2, __m128i a, __m128i b)

各WORDについて符号なしで比較を行い①!=②なら1を、そうでなければ0を③の対応するビットにセット
k2のビットが0の要素は処理されず③の対応するビットは0になる。③の上位ビットは0クリアされる。
VPCMPUW k1{k2}, ymm2, ymm3/m256, 4    (V5+BW+VL
__mmask16 _mm256_cmpneq_epu16_mask(__m256i a, __m256i b)
__mmask16 _mm256_mask_cmpneq_epu16_mask(__mmask16 k2, __m256i a, __m256i b)

各WORDについて符号なしで比較を行い①!=②なら1を、そうでなければ0を③の対応するビットにセット
k2のビットが0の要素は処理されず③の対応するビットは0になる。③の上位ビットは0クリアされる。
VPCMPUW k1{k2}, zmm2, zmm3/m512, 4    (V5+BW
__mmask32 _mm512_cmpneq_epu16_mask(__m512i a, __m512i b)
__mmask32 _mm512_mask_cmpneq_epu16_mask(__mmask32 k2, __m512i a, __m512i b)

各WORDについて符号なしで比較を行い①!=②なら1を、そうでなければ0を③の対応するビットにセット
k2のビットが0の要素は処理されず③の対応するビットは0になる。③の上位ビットは0クリアされる。

x86/x64 SIMD命令一覧表  フィードバック