CodeGen/X86/vec_shift6.ll

*9880d681SAndroid Build Coastguard Worker; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
*9880d681SAndroid Build Coastguard Worker; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mattr=sse4.1 | FileCheck %s --check-prefix=SSE
*9880d681SAndroid Build Coastguard Worker; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mattr=avx2 | FileCheck %s --check-prefix=AVX2
*9880d681SAndroid Build Coastguard Worker; RUN: llc < %s -mtriple=x86_64-unknown-linux-gnu -mattr=avx512f | FileCheck %s --check-prefix=AVX512
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Worker; Verify that we don't scalarize a packed vector shift left of 16-bit
*9880d681SAndroid Build Coastguard Worker; signed integers if the amount is a constant build_vector.
*9880d681SAndroid Build Coastguard Worker; Check that we produce a SSE2 packed integer multiply (pmullw) instead.
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <8 x i16> @test1(<8 x i16> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test1:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmullw {{.*}}(%rip), %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test1:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpmullw {{.*}}(%rip), %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test1:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpmullw {{.*}}(%rip), %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <8 x i16> %a, <i16 1, i16 1, i16 2, i16 3, i16 7, i16 0, i16 9, i16 11>
*9880d681SAndroid Build Coastguard Worker  ret <8 x i16> %shl
*9880d681SAndroid Build Coastguard Worker}
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <8 x i16> @test2(<8 x i16> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test2:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmullw {{.*}}(%rip), %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test2:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpmullw {{.*}}(%rip), %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test2:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpmullw {{.*}}(%rip), %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <8 x i16> %a, <i16 0, i16 undef, i16 0, i16 0, i16 1, i16 undef, i16 -1, i16 1>
*9880d681SAndroid Build Coastguard Worker  ret <8 x i16> %shl
*9880d681SAndroid Build Coastguard Worker}
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Worker; Verify that a vector shift left of 32-bit signed integers is simply expanded
*9880d681SAndroid Build Coastguard Worker; into a SSE4.1 pmulld (instead of cvttps2dq + pmulld) if the vector of shift
*9880d681SAndroid Build Coastguard Worker; counts is a constant build_vector.
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <4 x i32> @test3(<4 x i32> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test3:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmulld {{.*}}(%rip), %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test3:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpsllvd {{.*}}(%rip), %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test3:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpsllvd {{.*}}(%rip), %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <4 x i32> %a, <i32 1, i32 -1, i32 2, i32 -3>
*9880d681SAndroid Build Coastguard Worker  ret <4 x i32> %shl
*9880d681SAndroid Build Coastguard Worker}
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <4 x i32> @test4(<4 x i32> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test4:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmulld {{.*}}(%rip), %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test4:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpsllvd {{.*}}(%rip), %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test4:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpsllvd {{.*}}(%rip), %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <4 x i32> %a, <i32 0, i32 0, i32 1, i32 1>
*9880d681SAndroid Build Coastguard Worker  ret <4 x i32> %shl
*9880d681SAndroid Build Coastguard Worker}
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Worker; If we have AVX/SSE2 but not AVX2, verify that the following shift is split
*9880d681SAndroid Build Coastguard Worker; into two pmullw instructions. With AVX2, the test case below would produce
*9880d681SAndroid Build Coastguard Worker; a single vpmullw.
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <16 x i16> @test5(<16 x i16> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test5:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    movdqa {{.*#+}} xmm2 = [2,2,4,8,128,1,512,2048]
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmullw %xmm2, %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmullw %xmm2, %xmm1
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test5:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpmullw {{.*}}(%rip), %ymm0, %ymm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test5:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpmullw {{.*}}(%rip), %ymm0, %ymm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <16 x i16> %a, <i16 1, i16 1, i16 2, i16 3, i16 7, i16 0, i16 9, i16 11, i16 1, i16 1, i16 2, i16 3, i16 7, i16 0, i16 9, i16 11>
*9880d681SAndroid Build Coastguard Worker  ret <16 x i16> %shl
*9880d681SAndroid Build Coastguard Worker}
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Worker; If we have AVX/SSE4.1 but not AVX2, verify that the following shift is split
*9880d681SAndroid Build Coastguard Worker; into two pmulld instructions. With AVX2, the test case below would produce
*9880d681SAndroid Build Coastguard Worker; a single vpsllvd instead.
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <8 x i32> @test6(<8 x i32> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test6:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    movdqa {{.*#+}} xmm2 = [2,2,4,8]
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmulld %xmm2, %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmulld %xmm2, %xmm1
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test6:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpsllvd {{.*}}(%rip), %ymm0, %ymm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test6:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpsllvd {{.*}}(%rip), %ymm0, %ymm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <8 x i32> %a, <i32 1, i32 1, i32 2, i32 3, i32 1, i32 1, i32 2, i32 3>
*9880d681SAndroid Build Coastguard Worker  ret <8 x i32> %shl
*9880d681SAndroid Build Coastguard Worker}
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Worker; With AVX2 and AVX512, the test case below should produce a sequence of
*9880d681SAndroid Build Coastguard Worker; two vpmullw instructions. On SSE2 instead, we split the shift in four
*9880d681SAndroid Build Coastguard Worker; parts and then we convert each part into a pmullw.
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <32 x i16> @test7(<32 x i16> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test7:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    movdqa {{.*#+}} xmm4 = [2,2,4,8,128,1,512,2048]
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmullw %xmm4, %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmullw %xmm4, %xmm1
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmullw %xmm4, %xmm2
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmullw %xmm4, %xmm3
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test7:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vmovdqa {{.*#+}} ymm2 = [2,2,4,8,128,1,512,2048,2,2,4,8,128,1,512,2048]
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpmullw %ymm2, %ymm0, %ymm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpmullw %ymm2, %ymm1, %ymm1
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test7:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vmovdqa {{.*#+}} ymm2 = [2,2,4,8,128,1,512,2048,2,2,4,8,128,1,512,2048]
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpmullw %ymm2, %ymm0, %ymm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpmullw %ymm2, %ymm1, %ymm1
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <32 x i16> %a, <i16 1, i16 1, i16 2, i16 3, i16 7, i16 0, i16 9, i16 11, i16 1, i16 1, i16 2, i16 3, i16 7, i16 0, i16 9, i16 11, i16 1, i16 1, i16 2, i16 3, i16 7, i16 0, i16 9, i16 11, i16 1, i16 1, i16 2, i16 3, i16 7, i16 0, i16 9, i16 11>
*9880d681SAndroid Build Coastguard Worker  ret <32 x i16> %shl
*9880d681SAndroid Build Coastguard Worker}
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Worker; Similar to test7; the difference is that with AVX512 support
*9880d681SAndroid Build Coastguard Worker; we only produce a single vpsllvd/vpsllvq instead of a pair of vpsllvd/vpsllvq.
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <16 x i32> @test8(<16 x i32> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test8:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    movdqa {{.*#+}} xmm4 = [2,2,4,8]
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmulld %xmm4, %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmulld %xmm4, %xmm1
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmulld %xmm4, %xmm2
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pmulld %xmm4, %xmm3
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test8:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vmovdqa {{.*#+}} ymm2 = [1,1,2,3,1,1,2,3]
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpsllvd %ymm2, %ymm0, %ymm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpsllvd %ymm2, %ymm1, %ymm1
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test8:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpsllvd {{.*}}(%rip), %zmm0, %zmm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <16 x i32> %a, <i32 1, i32 1, i32 2, i32 3, i32 1, i32 1, i32 2, i32 3, i32 1, i32 1, i32 2, i32 3, i32 1, i32 1, i32 2, i32 3>
*9880d681SAndroid Build Coastguard Worker  ret <16 x i32> %shl
*9880d681SAndroid Build Coastguard Worker}
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Worker; The shift from 'test9' gets shifted separately and blended if we don't have AVX2/AVX512f support.
*9880d681SAndroid Build Coastguard Worker
*9880d681SAndroid Build Coastguard Workerdefine <8 x i64> @test9(<8 x i64> %a) {
*9880d681SAndroid Build Coastguard Worker; SSE-LABEL: test9:
*9880d681SAndroid Build Coastguard Worker; SSE:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    movdqa %xmm1, %xmm4
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    psllq $3, %xmm4
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    psllq $2, %xmm1
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pblendw {{.*#+}} xmm1 = xmm1[0,1,2,3],xmm4[4,5,6,7]
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    movdqa %xmm3, %xmm4
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    psllq $3, %xmm4
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    psllq $2, %xmm3
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    pblendw {{.*#+}} xmm3 = xmm3[0,1,2,3],xmm4[4,5,6,7]
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    paddq %xmm0, %xmm0
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    paddq %xmm2, %xmm2
*9880d681SAndroid Build Coastguard Worker; SSE-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX2-LABEL: test9:
*9880d681SAndroid Build Coastguard Worker; AVX2:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vmovdqa {{.*#+}} ymm2 = [1,1,2,3]
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpsllvq %ymm2, %ymm0, %ymm0
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    vpsllvq %ymm2, %ymm1, %ymm1
*9880d681SAndroid Build Coastguard Worker; AVX2-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker;
*9880d681SAndroid Build Coastguard Worker; AVX512-LABEL: test9:
*9880d681SAndroid Build Coastguard Worker; AVX512:       # BB#0:
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    vpsllvq {{.*}}(%rip), %zmm0, %zmm0
*9880d681SAndroid Build Coastguard Worker; AVX512-NEXT:    retq
*9880d681SAndroid Build Coastguard Worker  %shl = shl <8 x i64> %a, <i64 1, i64 1, i64 2, i64 3, i64 1, i64 1, i64 2, i64 3>
*9880d681SAndroid Build Coastguard Worker  ret <8 x i64> %shl
*9880d681SAndroid Build Coastguard Worker}