math/test/ulp_wrappers.h

*412f47f9SXin Li// clang-format off
*412f47f9SXin Li/*
*412f47f9SXin Li * Function wrappers for ulp.
*412f47f9SXin Li *
*412f47f9SXin Li * Copyright (c) 2022-2024, Arm Limited.
*412f47f9SXin Li * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*412f47f9SXin Li */
*412f47f9SXin Li
*412f47f9SXin Li#define _GNU_SOURCE
*412f47f9SXin Li#include <stdbool.h>
*412f47f9SXin Li#include <arm_neon.h>
*412f47f9SXin Li
*412f47f9SXin Li#if USE_MPFR
*412f47f9SXin Listatic int sincos_mpfr_sin(mpfr_t y, const mpfr_t x, mpfr_rnd_t r) {
*412f47f9SXin Li  mpfr_cos(y, x, r);
*412f47f9SXin Li  return mpfr_sin(y, x, r);
*412f47f9SXin Li}
*412f47f9SXin Listatic int sincos_mpfr_cos(mpfr_t y, const mpfr_t x, mpfr_rnd_t r) {
*412f47f9SXin Li  mpfr_sin(y, x, r);
*412f47f9SXin Li  return mpfr_cos(y, x, r);
*412f47f9SXin Li}
*412f47f9SXin Listatic int wrap_mpfr_powi(mpfr_t ret, const mpfr_t x, const mpfr_t y, mpfr_rnd_t rnd) {
*412f47f9SXin Li  mpfr_t y2;
*412f47f9SXin Li  mpfr_init(y2);
*412f47f9SXin Li  mpfr_trunc(y2, y);
*412f47f9SXin Li  return mpfr_pow(ret, x, y2, rnd);
*412f47f9SXin Li}
*412f47f9SXin Li#endif
*412f47f9SXin Li
*412f47f9SXin Li/* Our implementations of powi/powk are too imprecise to verify
*412f47f9SXin Li   against any established pow implementation. Instead we have the
*412f47f9SXin Li   following simple implementation, against which it is enough to
*412f47f9SXin Li   maintain bitwise reproducibility. Note the test framework expects
*412f47f9SXin Li   the reference impl to be of higher precision than the function
*412f47f9SXin Li   under test. For instance this means that the reference for
*412f47f9SXin Li   double-precision powi will be passed a long double, so to check
*412f47f9SXin Li   bitwise reproducibility we have to cast it back down to
*412f47f9SXin Li   double. This is fine since a round-trip to higher precision and
*412f47f9SXin Li   back down is correctly rounded.  */
*412f47f9SXin Li#define DECL_POW_INT_REF(NAME, DBL_T, FLT_T, INT_T)                            \
*412f47f9SXin Li  static DBL_T __attribute__((unused)) NAME (DBL_T in_val, DBL_T y)            \
*412f47f9SXin Li  {                                                                            \
*412f47f9SXin Li    INT_T n = (INT_T) round (y);                                               \
*412f47f9SXin Li    FLT_T acc = 1.0;                                                           \
*412f47f9SXin Li    bool want_recip = n < 0;                                                   \
*412f47f9SXin Li    n = n < 0 ? -n : n;                                                        \
*412f47f9SXin Li                                                                               \
*412f47f9SXin Li    for (FLT_T c = in_val; n; c *= c, n >>= 1)                                 \
*412f47f9SXin Li      {                                                                        \
*412f47f9SXin Li        if (n & 0x1)                                                           \
*412f47f9SXin Li          {                                                                    \
*412f47f9SXin Li            acc *= c;                                                          \
*412f47f9SXin Li          }                                                                    \
*412f47f9SXin Li      }                                                                        \
*412f47f9SXin Li    if (want_recip)                                                            \
*412f47f9SXin Li      {                                                                        \
*412f47f9SXin Li        acc = 1.0 / acc;                                                       \
*412f47f9SXin Li      }                                                                        \
*412f47f9SXin Li    return acc;                                                                \
*412f47f9SXin Li  }
*412f47f9SXin Li
*412f47f9SXin LiDECL_POW_INT_REF(ref_powif, double, float, int)
*412f47f9SXin LiDECL_POW_INT_REF(ref_powi, long double, double, int)
*412f47f9SXin Li
*412f47f9SXin Li#define ZVF1_WRAP(func) static float Z_##func##f(float x) { return _ZGVnN4v_##func##f(argf(x))[0]; }
*412f47f9SXin Li#define ZVF2_WRAP(func) static float Z_##func##f(float x, float y) { return _ZGVnN4vv_##func##f(argf(x), argf(y))[0]; }
*412f47f9SXin Li#define ZVD1_WRAP(func) static double Z_##func(double x) { return _ZGVnN2v_##func(argd(x))[0]; }
*412f47f9SXin Li#define ZVD2_WRAP(func) static double Z_##func(double x, double y) { return _ZGVnN2vv_##func(argd(x), argd(y))[0]; }
*412f47f9SXin Li
*412f47f9SXin Li#if defined(__vpcs) && __aarch64__
*412f47f9SXin Li
*412f47f9SXin Li#define ZVNF1_WRAP(func) ZVF1_WRAP(func)
*412f47f9SXin Li#define ZVNF2_WRAP(func) ZVF2_WRAP(func)
*412f47f9SXin Li#define ZVND1_WRAP(func) ZVD1_WRAP(func)
*412f47f9SXin Li#define ZVND2_WRAP(func) ZVD2_WRAP(func)
*412f47f9SXin Li
*412f47f9SXin Li#else
*412f47f9SXin Li
*412f47f9SXin Li#define ZVNF1_WRAP(func)
*412f47f9SXin Li#define ZVNF2_WRAP(func)
*412f47f9SXin Li#define ZVND1_WRAP(func)
*412f47f9SXin Li#define ZVND2_WRAP(func)
*412f47f9SXin Li
*412f47f9SXin Li#endif
*412f47f9SXin Li
*412f47f9SXin Li#define ZSVF1_WRAP(func) static float Z_sv_##func##f(svbool_t pg, float x) { return svretf(_ZGVsMxv_##func##f(svargf(x), pg), pg); }
*412f47f9SXin Li#define ZSVF2_WRAP(func) static float Z_sv_##func##f(svbool_t pg, float x, float y) { return svretf(_ZGVsMxvv_##func##f(svargf(x), svargf(y), pg), pg); }
*412f47f9SXin Li#define ZSVD1_WRAP(func) static double Z_sv_##func(svbool_t pg, double x) { return svretd(_ZGVsMxv_##func(svargd(x), pg), pg); }
*412f47f9SXin Li#define ZSVD2_WRAP(func) static double Z_sv_##func(svbool_t pg, double x, double y) { return svretd(_ZGVsMxvv_##func(svargd(x), svargd(y), pg), pg); }
*412f47f9SXin Li
*412f47f9SXin Li#if WANT_SVE_MATH
*412f47f9SXin Li
*412f47f9SXin Li#define ZSVNF1_WRAP(func) ZSVF1_WRAP(func)
*412f47f9SXin Li#define ZSVNF2_WRAP(func) ZSVF2_WRAP(func)
*412f47f9SXin Li#define ZSVND1_WRAP(func) ZSVD1_WRAP(func)
*412f47f9SXin Li#define ZSVND2_WRAP(func) ZSVD2_WRAP(func)
*412f47f9SXin Li
*412f47f9SXin Li#else
*412f47f9SXin Li
*412f47f9SXin Li#define ZSVNF1_WRAP(func)
*412f47f9SXin Li#define ZSVNF2_WRAP(func)
*412f47f9SXin Li#define ZSVND1_WRAP(func)
*412f47f9SXin Li#define ZSVND2_WRAP(func)
*412f47f9SXin Li
*412f47f9SXin Li#endif
*412f47f9SXin Li
*412f47f9SXin Li/* No wrappers for scalar routines, but PL_SIG will emit them.  */
*412f47f9SXin Li#define ZSNF1_WRAP(func)
*412f47f9SXin Li#define ZSNF2_WRAP(func)
*412f47f9SXin Li#define ZSND1_WRAP(func)
*412f47f9SXin Li#define ZSND2_WRAP(func)
*412f47f9SXin Li
*412f47f9SXin Li#include "ulp_wrappers_gen.h"
*412f47f9SXin Li
*412f47f9SXin Lifloat v_sincosf_sin(float x) { float32x4_t s, c; _ZGVnN4vl4l4_sincosf(vdupq_n_f32(x), &s, &c); return s[0]; }
*412f47f9SXin Lifloat v_sincosf_cos(float x) { float32x4_t s, c; _ZGVnN4vl4l4_sincosf(vdupq_n_f32(x), &s, &c); return c[0]; }
*412f47f9SXin Lifloat v_cexpif_sin(float x) { return _ZGVnN4v_cexpif(vdupq_n_f32(x)).val[0][0]; }
*412f47f9SXin Lifloat v_cexpif_cos(float x) { return _ZGVnN4v_cexpif(vdupq_n_f32(x)).val[1][0]; }
*412f47f9SXin Li
*412f47f9SXin Lidouble v_sincos_sin(double x) { float64x2_t s, c; _ZGVnN2vl8l8_sincos(vdupq_n_f64(x), &s, &c); return s[0]; }
*412f47f9SXin Lidouble v_sincos_cos(double x) { float64x2_t s, c; _ZGVnN2vl8l8_sincos(vdupq_n_f64(x), &s, &c); return c[0]; }
*412f47f9SXin Lidouble v_cexpi_sin(double x) { return _ZGVnN2v_cexpi(vdupq_n_f64(x)).val[0][0]; }
*412f47f9SXin Lidouble v_cexpi_cos(double x) { return _ZGVnN2v_cexpi(vdupq_n_f64(x)).val[1][0]; }
*412f47f9SXin Li
*412f47f9SXin Li#if WANT_SVE_MATH
*412f47f9SXin Listatic float Z_sv_powi(svbool_t pg, float x, float y) { return svretf(_ZGVsMxvv_powi(svargf(x), svdup_s32((int)round(y)), pg), pg); }
*412f47f9SXin Listatic double Z_sv_powk(svbool_t pg, double x, double y) { return svretd(_ZGVsMxvv_powk(svargd(x), svdup_s64((long)round(y)), pg), pg); }
*412f47f9SXin Li
*412f47f9SXin Lifloat sv_sincosf_sin(svbool_t pg, float x) { float s[svcntw()], c[svcntw()]; _ZGVsMxvl4l4_sincosf(svdup_f32(x), s, c, pg); return svretf(svld1(pg, s), pg); }
*412f47f9SXin Lifloat sv_sincosf_cos(svbool_t pg, float x) { float s[svcntw()], c[svcntw()]; _ZGVsMxvl4l4_sincosf(svdup_f32(x), s, c, pg); return svretf(svld1(pg, c), pg); }
*412f47f9SXin Lifloat sv_cexpif_sin(svbool_t pg, float x) { return svretf(svget2(_ZGVsMxv_cexpif(svdup_f32(x), pg), 0), pg); }
*412f47f9SXin Lifloat sv_cexpif_cos(svbool_t pg, float x) { return svretf(svget2(_ZGVsMxv_cexpif(svdup_f32(x), pg), 1), pg); }
*412f47f9SXin Li
*412f47f9SXin Lidouble sv_sincos_sin(svbool_t pg, double x) { double s[svcntd()], c[svcntd()]; _ZGVsMxvl8l8_sincos(svdup_f64(x), s, c, pg); return svretd(svld1(pg, s), pg); }
*412f47f9SXin Lidouble sv_sincos_cos(svbool_t pg, double x) { double s[svcntd()], c[svcntd()]; _ZGVsMxvl8l8_sincos(svdup_f64(x), s, c, pg); return svretd(svld1(pg, c), pg); }
*412f47f9SXin Lidouble sv_cexpi_sin(svbool_t pg, double x) { return svretd(svget2(_ZGVsMxv_cexpi(svdup_f64(x), pg), 0), pg); }
*412f47f9SXin Lidouble sv_cexpi_cos(svbool_t pg, double x) { return svretd(svget2(_ZGVsMxv_cexpi(svdup_f64(x), pg), 1), pg); }
*412f47f9SXin Li
*412f47f9SXin Li#endif
*412f47f9SXin Li// clang-format on