arm-optimized-routines/math/cosf.c

*412f47f9SXin Li/*
*412f47f9SXin Li * Single-precision cos function.
*412f47f9SXin Li *
*412f47f9SXin Li * Copyright (c) 2018-2021, Arm Limited.
*412f47f9SXin Li * SPDX-License-Identifier: MIT OR Apache-2.0 WITH LLVM-exception
*412f47f9SXin Li */
*412f47f9SXin Li
*412f47f9SXin Li#include <stdint.h>
*412f47f9SXin Li#include <math.h>
*412f47f9SXin Li#include "math_config.h"
*412f47f9SXin Li#include "sincosf.h"
*412f47f9SXin Li
*412f47f9SXin Li/* Fast cosf implementation.  Worst-case ULP is 0.5607, maximum relative
*412f47f9SXin Li   error is 0.5303 * 2^-23.  A single-step range reduction is used for
*412f47f9SXin Li   small values.  Large inputs have their range reduced using fast integer
*412f47f9SXin Li   arithmetic.  */
*412f47f9SXin Lifloat
*412f47f9SXin Licosf (float y)
*412f47f9SXin Li{
*412f47f9SXin Li  double x = y;
*412f47f9SXin Li  double s;
*412f47f9SXin Li  int n;
*412f47f9SXin Li  const sincos_t *p = &__sincosf_table[0];
*412f47f9SXin Li
*412f47f9SXin Li  if (abstop12 (y) < abstop12 (pio4f))
*412f47f9SXin Li    {
*412f47f9SXin Li      double x2 = x * x;
*412f47f9SXin Li
*412f47f9SXin Li      if (unlikely (abstop12 (y) < abstop12 (0x1p-12f)))
*412f47f9SXin Li	return 1.0f;
*412f47f9SXin Li
*412f47f9SXin Li      return sinf_poly (x, x2, p, 1);
*412f47f9SXin Li    }
*412f47f9SXin Li  else if (likely (abstop12 (y) < abstop12 (120.0f)))
*412f47f9SXin Li    {
*412f47f9SXin Li      x = reduce_fast (x, p, &n);
*412f47f9SXin Li
*412f47f9SXin Li      /* Setup the signs for sin and cos.  */
*412f47f9SXin Li      s = p->sign[n & 3];
*412f47f9SXin Li
*412f47f9SXin Li      if (n & 2)
*412f47f9SXin Li	p = &__sincosf_table[1];
*412f47f9SXin Li
*412f47f9SXin Li      return sinf_poly (x * s, x * x, p, n ^ 1);
*412f47f9SXin Li    }
*412f47f9SXin Li  else if (abstop12 (y) < abstop12 (INFINITY))
*412f47f9SXin Li    {
*412f47f9SXin Li      uint32_t xi = asuint (y);
*412f47f9SXin Li      int sign = xi >> 31;
*412f47f9SXin Li
*412f47f9SXin Li      x = reduce_large (xi, &n);
*412f47f9SXin Li
*412f47f9SXin Li      /* Setup signs for sin and cos - include original sign.  */
*412f47f9SXin Li      s = p->sign[(n + sign) & 3];
*412f47f9SXin Li
*412f47f9SXin Li      if ((n + sign) & 2)
*412f47f9SXin Li	p = &__sincosf_table[1];
*412f47f9SXin Li
*412f47f9SXin Li      return sinf_poly (x * s, x * x, p, n ^ 1);
*412f47f9SXin Li    }
*412f47f9SXin Li  else
*412f47f9SXin Li    return __math_invalidf (y);
*412f47f9SXin Li}