VPCOMPRESSW - Packed COMPRESS Word

VPCOMPRESSW xmm1/m128{k1}{z}, xmm2    (V5+VBMI2+VL
__m128i _mm_mask_compress_epi16(__m128i s, __mmask8 k, __m128i a)
__m128i _mm_maskz_compress_epi16(__mmask8 k, __m128i a)
void _mm_mask_compressstoreu_epi16(void* d, __mmask8 k, __m128i a)

①の要素のうち②の対応するビットが立っているものだけを集めて③の下位から詰める

③がXMMレジスタで、{z}指定があるとき(_maskz_のとき)は③の上位は0クリアされる
③がXMMレジスタで、{z}指定がない(_mask_のとき)ときは③の上位は不変(sの値が使われる)
③がメモリのとき(_compressstoreu_のとき)は③の上位はさわらない
VPCOMPRESSW ymm1/m256{k1}{z}, ymm2    (V5+VBMI2+VL
__m256i _mm256_mask_compress_epi16(__m256i s, __mmask16 k, __m256i a)
__m256i _mm256_maskz_compress_epi16(__mmask16 k, __m256i a)
void _mm256_mask_compressstoreu_epi16(void* d, __mmask16 k, __m256i a)

①の要素のうち②の対応するビットが立っているものだけを集めて③の下位から詰める

③がYMMレジスタで、{z}指定があるとき(_maskz_のとき)は③の上位は0クリアされる
③がYMMレジスタで、{z}指定がない(_mask_のとき)ときは③の上位は不変(sの値が使われる)
③がメモリのとき(_compressstoreu_のとき)は③の上位はさわらない
VPCOMPRESSW zmm1/m512{k1}{z}, zmm2    (V5+VBMI2
__m512i _mm512_mask_compress_epi16(__m512i s, __mmask32 k, __m512i a)
__m512i _mm512_maskz_compress_epi16(__mmask32 k, __m512i a)
void _mm512_mask_compressstoreu_epi16(void* d, __mmask32 k, __m512i a)
①の要素のうち②の対応するビットが立っているものだけを集めて③の下位から詰める

③がZMMレジスタで、{z}指定があるとき(_maskz_のとき)は③の上位は0クリアされる
③がZMMレジスタで、{z}指定がない(_mask_のとき)ときは③の上位は不変(sの値が使われる)
③がメモリのとき(_compressstoreu_のとき)は③の上位はさわらない

x86/x64 SIMD命令一覧表  フィードバック