1*67e74705SXin Li // REQUIRES: systemz-registered-target
2*67e74705SXin Li // RUN: %clang_cc1 -target-cpu z13 -triple s390x-ibm-linux -fno-lax-vector-conversions \
3*67e74705SXin Li // RUN: -Wall -Wno-unused -Werror -emit-llvm %s -o - | FileCheck %s
4*67e74705SXin Li
5*67e74705SXin Li typedef __attribute__((vector_size(16))) signed char vec_schar;
6*67e74705SXin Li typedef __attribute__((vector_size(16))) signed short vec_sshort;
7*67e74705SXin Li typedef __attribute__((vector_size(16))) signed int vec_sint;
8*67e74705SXin Li typedef __attribute__((vector_size(16))) signed long long vec_slong;
9*67e74705SXin Li typedef __attribute__((vector_size(16))) unsigned char vec_uchar;
10*67e74705SXin Li typedef __attribute__((vector_size(16))) unsigned short vec_ushort;
11*67e74705SXin Li typedef __attribute__((vector_size(16))) unsigned int vec_uint;
12*67e74705SXin Li typedef __attribute__((vector_size(16))) unsigned long long vec_ulong;
13*67e74705SXin Li typedef __attribute__((vector_size(16))) double vec_double;
14*67e74705SXin Li
15*67e74705SXin Li volatile vec_schar vsc;
16*67e74705SXin Li volatile vec_sshort vss;
17*67e74705SXin Li volatile vec_sint vsi;
18*67e74705SXin Li volatile vec_slong vsl;
19*67e74705SXin Li volatile vec_uchar vuc;
20*67e74705SXin Li volatile vec_ushort vus;
21*67e74705SXin Li volatile vec_uint vui;
22*67e74705SXin Li volatile vec_ulong vul;
23*67e74705SXin Li volatile vec_double vd;
24*67e74705SXin Li
25*67e74705SXin Li volatile unsigned int len;
26*67e74705SXin Li const void * volatile cptr;
27*67e74705SXin Li void * volatile ptr;
28*67e74705SXin Li int cc;
29*67e74705SXin Li
test_core(void)30*67e74705SXin Li void test_core(void) {
31*67e74705SXin Li len = __builtin_s390_lcbb(cptr, 0);
32*67e74705SXin Li // CHECK: call i32 @llvm.s390.lcbb(i8* %{{.*}}, i32 0)
33*67e74705SXin Li len = __builtin_s390_lcbb(cptr, 15);
34*67e74705SXin Li // CHECK: call i32 @llvm.s390.lcbb(i8* %{{.*}}, i32 15)
35*67e74705SXin Li
36*67e74705SXin Li vsc = __builtin_s390_vlbb(cptr, 0);
37*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vlbb(i8* %{{.*}}, i32 0)
38*67e74705SXin Li vsc = __builtin_s390_vlbb(cptr, 15);
39*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vlbb(i8* %{{.*}}, i32 15)
40*67e74705SXin Li
41*67e74705SXin Li vsc = __builtin_s390_vll(len, cptr);
42*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vll(i32 %{{.*}}, i8* %{{.*}})
43*67e74705SXin Li
44*67e74705SXin Li vul = __builtin_s390_vpdi(vul, vul, 0);
45*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vpdi(<2 x i64> %{{.*}}, <2 x i64> %{{.*}}, i32 0)
46*67e74705SXin Li vul = __builtin_s390_vpdi(vul, vul, 15);
47*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vpdi(<2 x i64> %{{.*}}, <2 x i64> %{{.*}}, i32 15)
48*67e74705SXin Li
49*67e74705SXin Li vuc = __builtin_s390_vperm(vuc, vuc, vuc);
50*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vperm(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}})
51*67e74705SXin Li
52*67e74705SXin Li vuc = __builtin_s390_vpklsh(vus, vus);
53*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vpklsh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
54*67e74705SXin Li vus = __builtin_s390_vpklsf(vui, vui);
55*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vpklsf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
56*67e74705SXin Li vui = __builtin_s390_vpklsg(vul, vul);
57*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vpklsg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
58*67e74705SXin Li
59*67e74705SXin Li vuc = __builtin_s390_vpklshs(vus, vus, &cc);
60*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vpklshs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
61*67e74705SXin Li vus = __builtin_s390_vpklsfs(vui, vui, &cc);
62*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vpklsfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
63*67e74705SXin Li vui = __builtin_s390_vpklsgs(vul, vul, &cc);
64*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vpklsgs(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
65*67e74705SXin Li
66*67e74705SXin Li vsc = __builtin_s390_vpksh(vss, vss);
67*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vpksh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
68*67e74705SXin Li vss = __builtin_s390_vpksf(vsi, vsi);
69*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vpksf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
70*67e74705SXin Li vsi = __builtin_s390_vpksg(vsl, vsl);
71*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vpksg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
72*67e74705SXin Li
73*67e74705SXin Li vsc = __builtin_s390_vpkshs(vss, vss, &cc);
74*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vpkshs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
75*67e74705SXin Li vss = __builtin_s390_vpksfs(vsi, vsi, &cc);
76*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vpksfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
77*67e74705SXin Li vsi = __builtin_s390_vpksgs(vsl, vsl, &cc);
78*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vpksgs(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
79*67e74705SXin Li
80*67e74705SXin Li __builtin_s390_vstl(vsc, len, ptr);
81*67e74705SXin Li // CHECK: call void @llvm.s390.vstl(<16 x i8> %{{.*}}, i32 %{{.*}}, i8* %{{.*}})
82*67e74705SXin Li
83*67e74705SXin Li vss = __builtin_s390_vuphb(vsc);
84*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vuphb(<16 x i8> %{{.*}})
85*67e74705SXin Li vsi = __builtin_s390_vuphh(vss);
86*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vuphh(<8 x i16> %{{.*}})
87*67e74705SXin Li vsl = __builtin_s390_vuphf(vsi);
88*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vuphf(<4 x i32> %{{.*}})
89*67e74705SXin Li
90*67e74705SXin Li vss = __builtin_s390_vuplb(vsc);
91*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vuplb(<16 x i8> %{{.*}})
92*67e74705SXin Li vsi = __builtin_s390_vuplhw(vss);
93*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vuplhw(<8 x i16> %{{.*}})
94*67e74705SXin Li vsl = __builtin_s390_vuplf(vsi);
95*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vuplf(<4 x i32> %{{.*}})
96*67e74705SXin Li
97*67e74705SXin Li vus = __builtin_s390_vuplhb(vuc);
98*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vuplhb(<16 x i8> %{{.*}})
99*67e74705SXin Li vui = __builtin_s390_vuplhh(vus);
100*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vuplhh(<8 x i16> %{{.*}})
101*67e74705SXin Li vul = __builtin_s390_vuplhf(vui);
102*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vuplhf(<4 x i32> %{{.*}})
103*67e74705SXin Li
104*67e74705SXin Li vus = __builtin_s390_vupllb(vuc);
105*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vupllb(<16 x i8> %{{.*}})
106*67e74705SXin Li vui = __builtin_s390_vupllh(vus);
107*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vupllh(<8 x i16> %{{.*}})
108*67e74705SXin Li vul = __builtin_s390_vupllf(vui);
109*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vupllf(<4 x i32> %{{.*}})
110*67e74705SXin Li }
111*67e74705SXin Li
test_integer(void)112*67e74705SXin Li void test_integer(void) {
113*67e74705SXin Li vuc = __builtin_s390_vaq(vuc, vuc);
114*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vaq(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
115*67e74705SXin Li vuc = __builtin_s390_vacq(vuc, vuc, vuc);
116*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vacq(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}})
117*67e74705SXin Li vuc = __builtin_s390_vaccq(vuc, vuc);
118*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vaccq(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
119*67e74705SXin Li vuc = __builtin_s390_vacccq(vuc, vuc, vuc);
120*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vacccq(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}})
121*67e74705SXin Li
122*67e74705SXin Li vuc = __builtin_s390_vaccb(vuc, vuc);
123*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vaccb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
124*67e74705SXin Li vus = __builtin_s390_vacch(vus, vus);
125*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vacch(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
126*67e74705SXin Li vui = __builtin_s390_vaccf(vui, vui);
127*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vaccf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
128*67e74705SXin Li vul = __builtin_s390_vaccg(vul, vul);
129*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vaccg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
130*67e74705SXin Li
131*67e74705SXin Li vsc = __builtin_s390_vavgb(vsc, vsc);
132*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vavgb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
133*67e74705SXin Li vss = __builtin_s390_vavgh(vss, vss);
134*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vavgh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
135*67e74705SXin Li vsi = __builtin_s390_vavgf(vsi, vsi);
136*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vavgf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
137*67e74705SXin Li vsl = __builtin_s390_vavgg(vsl, vsl);
138*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vavgg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
139*67e74705SXin Li
140*67e74705SXin Li vuc = __builtin_s390_vavglb(vuc, vuc);
141*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vavglb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
142*67e74705SXin Li vus = __builtin_s390_vavglh(vus, vus);
143*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vavglh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
144*67e74705SXin Li vui = __builtin_s390_vavglf(vui, vui);
145*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vavglf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
146*67e74705SXin Li vul = __builtin_s390_vavglg(vul, vul);
147*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vavglg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
148*67e74705SXin Li
149*67e74705SXin Li vui = __builtin_s390_vcksm(vui, vui);
150*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vcksm(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
151*67e74705SXin Li
152*67e74705SXin Li vuc = __builtin_s390_vclzb(vuc);
153*67e74705SXin Li // CHECK: call <16 x i8> @llvm.ctlz.v16i8(<16 x i8> %{{.*}}, i1 false)
154*67e74705SXin Li vus = __builtin_s390_vclzh(vus);
155*67e74705SXin Li // CHECK: call <8 x i16> @llvm.ctlz.v8i16(<8 x i16> %{{.*}}, i1 false)
156*67e74705SXin Li vui = __builtin_s390_vclzf(vui);
157*67e74705SXin Li // CHECK: call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %{{.*}}, i1 false)
158*67e74705SXin Li vul = __builtin_s390_vclzg(vul);
159*67e74705SXin Li // CHECK: call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %{{.*}}, i1 false)
160*67e74705SXin Li
161*67e74705SXin Li vuc = __builtin_s390_vctzb(vuc);
162*67e74705SXin Li // CHECK: call <16 x i8> @llvm.cttz.v16i8(<16 x i8> %{{.*}}, i1 false)
163*67e74705SXin Li vus = __builtin_s390_vctzh(vus);
164*67e74705SXin Li // CHECK: call <8 x i16> @llvm.cttz.v8i16(<8 x i16> %{{.*}}, i1 false)
165*67e74705SXin Li vui = __builtin_s390_vctzf(vui);
166*67e74705SXin Li // CHECK: call <4 x i32> @llvm.cttz.v4i32(<4 x i32> %{{.*}}, i1 false)
167*67e74705SXin Li vul = __builtin_s390_vctzg(vul);
168*67e74705SXin Li // CHECK: call <2 x i64> @llvm.cttz.v2i64(<2 x i64> %{{.*}}, i1 false)
169*67e74705SXin Li
170*67e74705SXin Li vuc = __builtin_s390_verimb(vuc, vuc, vuc, 0);
171*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.verimb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
172*67e74705SXin Li vuc = __builtin_s390_verimb(vuc, vuc, vuc, 255);
173*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.verimb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 255)
174*67e74705SXin Li vus = __builtin_s390_verimh(vus, vus, vus, 0);
175*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.verimh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
176*67e74705SXin Li vus = __builtin_s390_verimh(vus, vus, vus, 255);
177*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.verimh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 255)
178*67e74705SXin Li vui = __builtin_s390_verimf(vui, vui, vui, 0);
179*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.verimf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
180*67e74705SXin Li vui = __builtin_s390_verimf(vui, vui, vui, 255);
181*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.verimf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 255)
182*67e74705SXin Li vul = __builtin_s390_verimg(vul, vul, vul, 0);
183*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.verimg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}}, i32 0)
184*67e74705SXin Li vul = __builtin_s390_verimg(vul, vul, vul, 255);
185*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.verimg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}}, i32 255)
186*67e74705SXin Li
187*67e74705SXin Li vuc = __builtin_s390_verllb(vuc, len);
188*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.verllb(<16 x i8> %{{.*}}, i32 %{{.*}})
189*67e74705SXin Li vus = __builtin_s390_verllh(vus, len);
190*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.verllh(<8 x i16> %{{.*}}, i32 %{{.*}})
191*67e74705SXin Li vui = __builtin_s390_verllf(vui, len);
192*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.verllf(<4 x i32> %{{.*}}, i32 %{{.*}})
193*67e74705SXin Li vul = __builtin_s390_verllg(vul, len);
194*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.verllg(<2 x i64> %{{.*}}, i32 %{{.*}})
195*67e74705SXin Li
196*67e74705SXin Li vuc = __builtin_s390_verllvb(vuc, vuc);
197*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.verllvb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
198*67e74705SXin Li vus = __builtin_s390_verllvh(vus, vus);
199*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.verllvh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
200*67e74705SXin Li vui = __builtin_s390_verllvf(vui, vui);
201*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.verllvf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
202*67e74705SXin Li vul = __builtin_s390_verllvg(vul, vul);
203*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.verllvg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
204*67e74705SXin Li
205*67e74705SXin Li vus = __builtin_s390_vgfmb(vuc, vuc);
206*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vgfmb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
207*67e74705SXin Li vui = __builtin_s390_vgfmh(vus, vus);
208*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vgfmh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
209*67e74705SXin Li vul = __builtin_s390_vgfmf(vui, vui);
210*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vgfmf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
211*67e74705SXin Li vuc = __builtin_s390_vgfmg(vul, vul);
212*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vgfmg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
213*67e74705SXin Li
214*67e74705SXin Li vus = __builtin_s390_vgfmab(vuc, vuc, vus);
215*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vgfmab(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <8 x i16> %{{.*}})
216*67e74705SXin Li vui = __builtin_s390_vgfmah(vus, vus, vui);
217*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vgfmah(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <4 x i32> %{{.*}})
218*67e74705SXin Li vul = __builtin_s390_vgfmaf(vui, vui, vul);
219*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vgfmaf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <2 x i64> %{{.*}})
220*67e74705SXin Li vuc = __builtin_s390_vgfmag(vul, vul, vuc);
221*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vgfmag(<2 x i64> %{{.*}}, <2 x i64> %{{.*}}, <16 x i8> %{{.*}})
222*67e74705SXin Li
223*67e74705SXin Li vsc = __builtin_s390_vmahb(vsc, vsc, vsc);
224*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vmahb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}})
225*67e74705SXin Li vss = __builtin_s390_vmahh(vss, vss, vss);
226*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmahh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}})
227*67e74705SXin Li vsi = __builtin_s390_vmahf(vsi, vsi, vsi);
228*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmahf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}})
229*67e74705SXin Li vuc = __builtin_s390_vmalhb(vuc, vuc, vuc);
230*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vmalhb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}})
231*67e74705SXin Li vus = __builtin_s390_vmalhh(vus, vus, vus);
232*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmalhh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}})
233*67e74705SXin Li vui = __builtin_s390_vmalhf(vui, vui, vui);
234*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmalhf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}})
235*67e74705SXin Li
236*67e74705SXin Li vss = __builtin_s390_vmaeb(vsc, vsc, vss);
237*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmaeb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <8 x i16> %{{.*}})
238*67e74705SXin Li vsi = __builtin_s390_vmaeh(vss, vss, vsi);
239*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmaeh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <4 x i32> %{{.*}})
240*67e74705SXin Li vsl = __builtin_s390_vmaef(vsi, vsi, vsl);
241*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vmaef(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <2 x i64> %{{.*}})
242*67e74705SXin Li vus = __builtin_s390_vmaleb(vuc, vuc, vus);
243*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmaleb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <8 x i16> %{{.*}})
244*67e74705SXin Li vui = __builtin_s390_vmaleh(vus, vus, vui);
245*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmaleh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <4 x i32> %{{.*}})
246*67e74705SXin Li vul = __builtin_s390_vmalef(vui, vui, vul);
247*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vmalef(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <2 x i64> %{{.*}})
248*67e74705SXin Li
249*67e74705SXin Li vss = __builtin_s390_vmaob(vsc, vsc, vss);
250*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmaob(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <8 x i16> %{{.*}})
251*67e74705SXin Li vsi = __builtin_s390_vmaoh(vss, vss, vsi);
252*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmaoh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <4 x i32> %{{.*}})
253*67e74705SXin Li vsl = __builtin_s390_vmaof(vsi, vsi, vsl);
254*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vmaof(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <2 x i64> %{{.*}})
255*67e74705SXin Li vus = __builtin_s390_vmalob(vuc, vuc, vus);
256*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmalob(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <8 x i16> %{{.*}})
257*67e74705SXin Li vui = __builtin_s390_vmaloh(vus, vus, vui);
258*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmaloh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <4 x i32> %{{.*}})
259*67e74705SXin Li vul = __builtin_s390_vmalof(vui, vui, vul);
260*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vmalof(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <2 x i64> %{{.*}})
261*67e74705SXin Li
262*67e74705SXin Li vsc = __builtin_s390_vmhb(vsc, vsc);
263*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vmhb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
264*67e74705SXin Li vss = __builtin_s390_vmhh(vss, vss);
265*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmhh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
266*67e74705SXin Li vsi = __builtin_s390_vmhf(vsi, vsi);
267*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmhf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
268*67e74705SXin Li vuc = __builtin_s390_vmlhb(vuc, vuc);
269*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vmlhb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
270*67e74705SXin Li vus = __builtin_s390_vmlhh(vus, vus);
271*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmlhh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
272*67e74705SXin Li vui = __builtin_s390_vmlhf(vui, vui);
273*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmlhf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
274*67e74705SXin Li
275*67e74705SXin Li vss = __builtin_s390_vmeb(vsc, vsc);
276*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmeb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
277*67e74705SXin Li vsi = __builtin_s390_vmeh(vss, vss);
278*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmeh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
279*67e74705SXin Li vsl = __builtin_s390_vmef(vsi, vsi);
280*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vmef(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
281*67e74705SXin Li vus = __builtin_s390_vmleb(vuc, vuc);
282*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmleb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
283*67e74705SXin Li vui = __builtin_s390_vmleh(vus, vus);
284*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmleh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
285*67e74705SXin Li vul = __builtin_s390_vmlef(vui, vui);
286*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vmlef(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
287*67e74705SXin Li
288*67e74705SXin Li vss = __builtin_s390_vmob(vsc, vsc);
289*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmob(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
290*67e74705SXin Li vsi = __builtin_s390_vmoh(vss, vss);
291*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmoh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
292*67e74705SXin Li vsl = __builtin_s390_vmof(vsi, vsi);
293*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vmof(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
294*67e74705SXin Li vus = __builtin_s390_vmlob(vuc, vuc);
295*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vmlob(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
296*67e74705SXin Li vui = __builtin_s390_vmloh(vus, vus);
297*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vmloh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
298*67e74705SXin Li vul = __builtin_s390_vmlof(vui, vui);
299*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vmlof(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
300*67e74705SXin Li
301*67e74705SXin Li vuc = __builtin_s390_vpopctb(vuc);
302*67e74705SXin Li // CHECK: call <16 x i8> @llvm.ctpop.v16i8(<16 x i8> %{{.*}})
303*67e74705SXin Li vus = __builtin_s390_vpopcth(vus);
304*67e74705SXin Li // CHECK: call <8 x i16> @llvm.ctpop.v8i16(<8 x i16> %{{.*}})
305*67e74705SXin Li vui = __builtin_s390_vpopctf(vui);
306*67e74705SXin Li // CHECK: call <4 x i32> @llvm.ctpop.v4i32(<4 x i32> %{{.*}})
307*67e74705SXin Li vul = __builtin_s390_vpopctg(vul);
308*67e74705SXin Li // CHECK: call <2 x i64> @llvm.ctpop.v2i64(<2 x i64> %{{.*}})
309*67e74705SXin Li
310*67e74705SXin Li vuc = __builtin_s390_vsq(vuc, vuc);
311*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsq(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
312*67e74705SXin Li vuc = __builtin_s390_vsbiq(vuc, vuc, vuc);
313*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsbiq(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}})
314*67e74705SXin Li vuc = __builtin_s390_vscbiq(vuc, vuc);
315*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vscbiq(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
316*67e74705SXin Li vuc = __builtin_s390_vsbcbiq(vuc, vuc, vuc);
317*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsbcbiq(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}})
318*67e74705SXin Li
319*67e74705SXin Li vuc = __builtin_s390_vscbib(vuc, vuc);
320*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vscbib(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
321*67e74705SXin Li vus = __builtin_s390_vscbih(vus, vus);
322*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vscbih(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
323*67e74705SXin Li vui = __builtin_s390_vscbif(vui, vui);
324*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vscbif(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
325*67e74705SXin Li vul = __builtin_s390_vscbig(vul, vul);
326*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vscbig(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
327*67e74705SXin Li
328*67e74705SXin Li vuc = __builtin_s390_vsldb(vuc, vuc, 0);
329*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsldb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
330*67e74705SXin Li vuc = __builtin_s390_vsldb(vuc, vuc, 15);
331*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsldb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
332*67e74705SXin Li
333*67e74705SXin Li vuc = __builtin_s390_vsl(vuc, vuc);
334*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsl(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
335*67e74705SXin Li vuc = __builtin_s390_vslb(vuc, vuc);
336*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vslb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
337*67e74705SXin Li
338*67e74705SXin Li vuc = __builtin_s390_vsra(vuc, vuc);
339*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsra(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
340*67e74705SXin Li vuc = __builtin_s390_vsrab(vuc, vuc);
341*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsrab(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
342*67e74705SXin Li
343*67e74705SXin Li vuc = __builtin_s390_vsrl(vuc, vuc);
344*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsrl(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
345*67e74705SXin Li vuc = __builtin_s390_vsrlb(vuc, vuc);
346*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsrlb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
347*67e74705SXin Li
348*67e74705SXin Li vui = __builtin_s390_vsumb(vuc, vuc);
349*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vsumb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
350*67e74705SXin Li vui = __builtin_s390_vsumh(vus, vus);
351*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vsumh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
352*67e74705SXin Li vul = __builtin_s390_vsumgh(vus, vus);
353*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vsumgh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
354*67e74705SXin Li vul = __builtin_s390_vsumgf(vui, vui);
355*67e74705SXin Li // CHECK: call <2 x i64> @llvm.s390.vsumgf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
356*67e74705SXin Li vuc = __builtin_s390_vsumqf(vui, vui);
357*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsumqf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
358*67e74705SXin Li vuc = __builtin_s390_vsumqg(vul, vul);
359*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vsumqg(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
360*67e74705SXin Li
361*67e74705SXin Li len = __builtin_s390_vtm(vuc, vuc);
362*67e74705SXin Li // CHECK: call i32 @llvm.s390.vtm(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
363*67e74705SXin Li
364*67e74705SXin Li vsc = __builtin_s390_vceqbs(vsc, vsc, &cc);
365*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vceqbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
366*67e74705SXin Li vss = __builtin_s390_vceqhs(vss, vss, &cc);
367*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vceqhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
368*67e74705SXin Li vsi = __builtin_s390_vceqfs(vsi, vsi, &cc);
369*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vceqfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
370*67e74705SXin Li vsl = __builtin_s390_vceqgs(vsl, vsl, &cc);
371*67e74705SXin Li // CHECK: call { <2 x i64>, i32 } @llvm.s390.vceqgs(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
372*67e74705SXin Li
373*67e74705SXin Li vsc = __builtin_s390_vchbs(vsc, vsc, &cc);
374*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vchbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
375*67e74705SXin Li vss = __builtin_s390_vchhs(vss, vss, &cc);
376*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vchhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
377*67e74705SXin Li vsi = __builtin_s390_vchfs(vsi, vsi, &cc);
378*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vchfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
379*67e74705SXin Li vsl = __builtin_s390_vchgs(vsl, vsl, &cc);
380*67e74705SXin Li // CHECK: call { <2 x i64>, i32 } @llvm.s390.vchgs(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
381*67e74705SXin Li
382*67e74705SXin Li vsc = __builtin_s390_vchlbs(vuc, vuc, &cc);
383*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vchlbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
384*67e74705SXin Li vss = __builtin_s390_vchlhs(vus, vus, &cc);
385*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vchlhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
386*67e74705SXin Li vsi = __builtin_s390_vchlfs(vui, vui, &cc);
387*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vchlfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
388*67e74705SXin Li vsl = __builtin_s390_vchlgs(vul, vul, &cc);
389*67e74705SXin Li // CHECK: call { <2 x i64>, i32 } @llvm.s390.vchlgs(<2 x i64> %{{.*}}, <2 x i64> %{{.*}})
390*67e74705SXin Li }
391*67e74705SXin Li
test_string(void)392*67e74705SXin Li void test_string(void) {
393*67e74705SXin Li vuc = __builtin_s390_vfaeb(vuc, vuc, 0);
394*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vfaeb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
395*67e74705SXin Li vuc = __builtin_s390_vfaeb(vuc, vuc, 15);
396*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vfaeb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
397*67e74705SXin Li vus = __builtin_s390_vfaeh(vus, vus, 0);
398*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vfaeh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
399*67e74705SXin Li vus = __builtin_s390_vfaeh(vus, vus, 15);
400*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vfaeh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 15)
401*67e74705SXin Li vui = __builtin_s390_vfaef(vui, vui, 0);
402*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vfaef(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
403*67e74705SXin Li vui = __builtin_s390_vfaef(vui, vui, 15);
404*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vfaef(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 15)
405*67e74705SXin Li
406*67e74705SXin Li vuc = __builtin_s390_vfaezb(vuc, vuc, 0);
407*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vfaezb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
408*67e74705SXin Li vuc = __builtin_s390_vfaezb(vuc, vuc, 15);
409*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vfaezb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
410*67e74705SXin Li vus = __builtin_s390_vfaezh(vus, vus, 0);
411*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vfaezh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
412*67e74705SXin Li vus = __builtin_s390_vfaezh(vus, vus, 15);
413*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vfaezh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 15)
414*67e74705SXin Li vui = __builtin_s390_vfaezf(vui, vui, 0);
415*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vfaezf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
416*67e74705SXin Li vui = __builtin_s390_vfaezf(vui, vui, 15);
417*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vfaezf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 15)
418*67e74705SXin Li
419*67e74705SXin Li vuc = __builtin_s390_vfeeb(vuc, vuc);
420*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vfeeb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
421*67e74705SXin Li vus = __builtin_s390_vfeeh(vus, vus);
422*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vfeeh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
423*67e74705SXin Li vui = __builtin_s390_vfeef(vui, vui);
424*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vfeef(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
425*67e74705SXin Li
426*67e74705SXin Li vuc = __builtin_s390_vfeezb(vuc, vuc);
427*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vfeezb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
428*67e74705SXin Li vus = __builtin_s390_vfeezh(vus, vus);
429*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vfeezh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
430*67e74705SXin Li vui = __builtin_s390_vfeezf(vui, vui);
431*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vfeezf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
432*67e74705SXin Li
433*67e74705SXin Li vuc = __builtin_s390_vfeneb(vuc, vuc);
434*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vfeneb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
435*67e74705SXin Li vus = __builtin_s390_vfeneh(vus, vus);
436*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vfeneh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
437*67e74705SXin Li vui = __builtin_s390_vfenef(vui, vui);
438*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vfenef(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
439*67e74705SXin Li
440*67e74705SXin Li vuc = __builtin_s390_vfenezb(vuc, vuc);
441*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vfenezb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
442*67e74705SXin Li vus = __builtin_s390_vfenezh(vus, vus);
443*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vfenezh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
444*67e74705SXin Li vui = __builtin_s390_vfenezf(vui, vui);
445*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vfenezf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
446*67e74705SXin Li
447*67e74705SXin Li vuc = __builtin_s390_vistrb(vuc);
448*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vistrb(<16 x i8> %{{.*}})
449*67e74705SXin Li vus = __builtin_s390_vistrh(vus);
450*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vistrh(<8 x i16> %{{.*}})
451*67e74705SXin Li vui = __builtin_s390_vistrf(vui);
452*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vistrf(<4 x i32> %{{.*}})
453*67e74705SXin Li
454*67e74705SXin Li vuc = __builtin_s390_vstrcb(vuc, vuc, vuc, 0);
455*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vstrcb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
456*67e74705SXin Li vuc = __builtin_s390_vstrcb(vuc, vuc, vuc, 15);
457*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vstrcb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
458*67e74705SXin Li vus = __builtin_s390_vstrch(vus, vus, vus, 0);
459*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vstrch(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
460*67e74705SXin Li vus = __builtin_s390_vstrch(vus, vus, vus, 15);
461*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vstrch(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 15)
462*67e74705SXin Li vui = __builtin_s390_vstrcf(vui, vui, vui, 0);
463*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vstrcf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
464*67e74705SXin Li vui = __builtin_s390_vstrcf(vui, vui, vui, 15);
465*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vstrcf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 15)
466*67e74705SXin Li
467*67e74705SXin Li vuc = __builtin_s390_vstrczb(vuc, vuc, vuc, 0);
468*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vstrczb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
469*67e74705SXin Li vuc = __builtin_s390_vstrczb(vuc, vuc, vuc, 15);
470*67e74705SXin Li // CHECK: call <16 x i8> @llvm.s390.vstrczb(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
471*67e74705SXin Li vus = __builtin_s390_vstrczh(vus, vus, vus, 0);
472*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vstrczh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
473*67e74705SXin Li vus = __builtin_s390_vstrczh(vus, vus, vus, 15);
474*67e74705SXin Li // CHECK: call <8 x i16> @llvm.s390.vstrczh(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 15)
475*67e74705SXin Li vui = __builtin_s390_vstrczf(vui, vui, vui, 0);
476*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vstrczf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
477*67e74705SXin Li vui = __builtin_s390_vstrczf(vui, vui, vui, 15);
478*67e74705SXin Li // CHECK: call <4 x i32> @llvm.s390.vstrczf(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 15)
479*67e74705SXin Li
480*67e74705SXin Li vuc = __builtin_s390_vfaebs(vuc, vuc, 0, &cc);
481*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vfaebs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
482*67e74705SXin Li vuc = __builtin_s390_vfaebs(vuc, vuc, 15, &cc);
483*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vfaebs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
484*67e74705SXin Li vus = __builtin_s390_vfaehs(vus, vus, 0, &cc);
485*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vfaehs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
486*67e74705SXin Li vus = __builtin_s390_vfaehs(vus, vus, 15, &cc);
487*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vfaehs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 15)
488*67e74705SXin Li vui = __builtin_s390_vfaefs(vui, vui, 0, &cc);
489*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vfaefs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
490*67e74705SXin Li vui = __builtin_s390_vfaefs(vui, vui, 15, &cc);
491*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vfaefs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 15)
492*67e74705SXin Li
493*67e74705SXin Li vuc = __builtin_s390_vfaezbs(vuc, vuc, 0, &cc);
494*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vfaezbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
495*67e74705SXin Li vuc = __builtin_s390_vfaezbs(vuc, vuc, 15, &cc);
496*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vfaezbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
497*67e74705SXin Li vus = __builtin_s390_vfaezhs(vus, vus, 0, &cc);
498*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vfaezhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
499*67e74705SXin Li vus = __builtin_s390_vfaezhs(vus, vus, 15, &cc);
500*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vfaezhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 15)
501*67e74705SXin Li vui = __builtin_s390_vfaezfs(vui, vui, 0, &cc);
502*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vfaezfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
503*67e74705SXin Li vui = __builtin_s390_vfaezfs(vui, vui, 15, &cc);
504*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vfaezfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 15)
505*67e74705SXin Li
506*67e74705SXin Li vuc = __builtin_s390_vfeebs(vuc, vuc, &cc);
507*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vfeebs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
508*67e74705SXin Li vus = __builtin_s390_vfeehs(vus, vus, &cc);
509*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vfeehs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
510*67e74705SXin Li vui = __builtin_s390_vfeefs(vui, vui, &cc);
511*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vfeefs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
512*67e74705SXin Li
513*67e74705SXin Li vuc = __builtin_s390_vfeezbs(vuc, vuc, &cc);
514*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vfeezbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
515*67e74705SXin Li vus = __builtin_s390_vfeezhs(vus, vus, &cc);
516*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vfeezhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
517*67e74705SXin Li vui = __builtin_s390_vfeezfs(vui, vui, &cc);
518*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vfeezfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
519*67e74705SXin Li
520*67e74705SXin Li vuc = __builtin_s390_vfenebs(vuc, vuc, &cc);
521*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vfenebs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
522*67e74705SXin Li vus = __builtin_s390_vfenehs(vus, vus, &cc);
523*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vfenehs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
524*67e74705SXin Li vui = __builtin_s390_vfenefs(vui, vui, &cc);
525*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vfenefs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
526*67e74705SXin Li
527*67e74705SXin Li vuc = __builtin_s390_vfenezbs(vuc, vuc, &cc);
528*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vfenezbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}})
529*67e74705SXin Li vus = __builtin_s390_vfenezhs(vus, vus, &cc);
530*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vfenezhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}})
531*67e74705SXin Li vui = __builtin_s390_vfenezfs(vui, vui, &cc);
532*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vfenezfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}})
533*67e74705SXin Li
534*67e74705SXin Li vuc = __builtin_s390_vistrbs(vuc, &cc);
535*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vistrbs(<16 x i8> %{{.*}})
536*67e74705SXin Li vus = __builtin_s390_vistrhs(vus, &cc);
537*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vistrhs(<8 x i16> %{{.*}})
538*67e74705SXin Li vui = __builtin_s390_vistrfs(vui, &cc);
539*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vistrfs(<4 x i32> %{{.*}})
540*67e74705SXin Li
541*67e74705SXin Li vuc = __builtin_s390_vstrcbs(vuc, vuc, vuc, 0, &cc);
542*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vstrcbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
543*67e74705SXin Li vuc = __builtin_s390_vstrcbs(vuc, vuc, vuc, 15, &cc);
544*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vstrcbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
545*67e74705SXin Li vus = __builtin_s390_vstrchs(vus, vus, vus, 0, &cc);
546*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vstrchs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
547*67e74705SXin Li vus = __builtin_s390_vstrchs(vus, vus, vus, 15, &cc);
548*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vstrchs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 15)
549*67e74705SXin Li vui = __builtin_s390_vstrcfs(vui, vui, vui, 0, &cc);
550*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vstrcfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
551*67e74705SXin Li vui = __builtin_s390_vstrcfs(vui, vui, vui, 15, &cc);
552*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vstrcfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 15)
553*67e74705SXin Li
554*67e74705SXin Li vuc = __builtin_s390_vstrczbs(vuc, vuc, vuc, 0, &cc);
555*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vstrczbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 0)
556*67e74705SXin Li vuc = __builtin_s390_vstrczbs(vuc, vuc, vuc, 15, &cc);
557*67e74705SXin Li // CHECK: call { <16 x i8>, i32 } @llvm.s390.vstrczbs(<16 x i8> %{{.*}}, <16 x i8> %{{.*}}, <16 x i8> %{{.*}}, i32 15)
558*67e74705SXin Li vus = __builtin_s390_vstrczhs(vus, vus, vus, 0, &cc);
559*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vstrczhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 0)
560*67e74705SXin Li vus = __builtin_s390_vstrczhs(vus, vus, vus, 15, &cc);
561*67e74705SXin Li // CHECK: call { <8 x i16>, i32 } @llvm.s390.vstrczhs(<8 x i16> %{{.*}}, <8 x i16> %{{.*}}, <8 x i16> %{{.*}}, i32 15)
562*67e74705SXin Li vui = __builtin_s390_vstrczfs(vui, vui, vui, 0, &cc);
563*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vstrczfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 0)
564*67e74705SXin Li vui = __builtin_s390_vstrczfs(vui, vui, vui, 15, &cc);
565*67e74705SXin Li // CHECK: call { <4 x i32>, i32 } @llvm.s390.vstrczfs(<4 x i32> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}}, i32 15)
566*67e74705SXin Li }
567*67e74705SXin Li
test_float(void)568*67e74705SXin Li void test_float(void) {
569*67e74705SXin Li vsl = __builtin_s390_vfcedbs(vd, vd, &cc);
570*67e74705SXin Li // CHECK: call { <2 x i64>, i32 } @llvm.s390.vfcedbs(<2 x double> %{{.*}}, <2 x double> %{{.*}})
571*67e74705SXin Li vsl = __builtin_s390_vfchdbs(vd, vd, &cc);
572*67e74705SXin Li // CHECK: call { <2 x i64>, i32 } @llvm.s390.vfchdbs(<2 x double> %{{.*}}, <2 x double> %{{.*}})
573*67e74705SXin Li vsl = __builtin_s390_vfchedbs(vd, vd, &cc);
574*67e74705SXin Li // CHECK: call { <2 x i64>, i32 } @llvm.s390.vfchedbs(<2 x double> %{{.*}}, <2 x double> %{{.*}})
575*67e74705SXin Li
576*67e74705SXin Li vsl = __builtin_s390_vftcidb(vd, 0, &cc);
577*67e74705SXin Li // CHECK: call { <2 x i64>, i32 } @llvm.s390.vftcidb(<2 x double> %{{.*}}, i32 0)
578*67e74705SXin Li vsl = __builtin_s390_vftcidb(vd, 4095, &cc);
579*67e74705SXin Li // CHECK: call { <2 x i64>, i32 } @llvm.s390.vftcidb(<2 x double> %{{.*}}, i32 4095)
580*67e74705SXin Li
581*67e74705SXin Li vd = __builtin_s390_vfsqdb(vd);
582*67e74705SXin Li // CHECK: call <2 x double> @llvm.sqrt.v2f64(<2 x double> %{{.*}})
583*67e74705SXin Li
584*67e74705SXin Li vd = __builtin_s390_vfmadb(vd, vd, vd);
585*67e74705SXin Li // CHECK: call <2 x double> @llvm.fma.v2f64(<2 x double> %{{.*}}, <2 x double> %{{.*}}, <2 x double> %{{.*}})
586*67e74705SXin Li vd = __builtin_s390_vfmsdb(vd, vd, vd);
587*67e74705SXin Li // CHECK: [[NEG:%[^ ]+]] = fsub <2 x double> <double -0.000000e+00, double -0.000000e+00>, %{{.*}}
588*67e74705SXin Li // CHECK: call <2 x double> @llvm.fma.v2f64(<2 x double> %{{.*}}, <2 x double> %{{.*}}, <2 x double> [[NEG]])
589*67e74705SXin Li
590*67e74705SXin Li vd = __builtin_s390_vflpdb(vd);
591*67e74705SXin Li // CHECK: call <2 x double> @llvm.fabs.v2f64(<2 x double> %{{.*}})
592*67e74705SXin Li vd = __builtin_s390_vflndb(vd);
593*67e74705SXin Li // CHECK: [[ABS:%[^ ]+]] = call <2 x double> @llvm.fabs.v2f64(<2 x double> %{{.*}})
594*67e74705SXin Li // CHECK: fsub <2 x double> <double -0.000000e+00, double -0.000000e+00>, [[ABS]]
595*67e74705SXin Li
596*67e74705SXin Li vd = __builtin_s390_vfidb(vd, 0, 0);
597*67e74705SXin Li // CHECK: call <2 x double> @llvm.rint.v2f64(<2 x double> %{{.*}})
598*67e74705SXin Li vd = __builtin_s390_vfidb(vd, 4, 0);
599*67e74705SXin Li // CHECK: call <2 x double> @llvm.nearbyint.v2f64(<2 x double> %{{.*}})
600*67e74705SXin Li vd = __builtin_s390_vfidb(vd, 4, 1);
601*67e74705SXin Li // CHECK: call <2 x double> @llvm.round.v2f64(<2 x double> %{{.*}})
602*67e74705SXin Li vd = __builtin_s390_vfidb(vd, 4, 5);
603*67e74705SXin Li // CHECK: call <2 x double> @llvm.trunc.v2f64(<2 x double> %{{.*}})
604*67e74705SXin Li vd = __builtin_s390_vfidb(vd, 4, 6);
605*67e74705SXin Li // CHECK: call <2 x double> @llvm.ceil.v2f64(<2 x double> %{{.*}})
606*67e74705SXin Li vd = __builtin_s390_vfidb(vd, 4, 7);
607*67e74705SXin Li // CHECK: call <2 x double> @llvm.floor.v2f64(<2 x double> %{{.*}})
608*67e74705SXin Li vd = __builtin_s390_vfidb(vd, 4, 4);
609*67e74705SXin Li // CHECK: call <2 x double> @llvm.s390.vfidb(<2 x double> %{{.*}}, i32 4, i32 4)
610*67e74705SXin Li }
611