rnnoise/src/arch.h

*1295d682SXin Li/* Copyright (c) 2003-2008 Jean-Marc Valin
*1295d682SXin Li   Copyright (c) 2007-2008 CSIRO
*1295d682SXin Li   Copyright (c) 2007-2009 Xiph.Org Foundation
*1295d682SXin Li   Written by Jean-Marc Valin */
*1295d682SXin Li/**
*1295d682SXin Li   @file arch.h
*1295d682SXin Li   @brief Various architecture definitions for CELT
*1295d682SXin Li*/
*1295d682SXin Li/*
*1295d682SXin Li   Redistribution and use in source and binary forms, with or without
*1295d682SXin Li   modification, are permitted provided that the following conditions
*1295d682SXin Li   are met:
*1295d682SXin Li
*1295d682SXin Li   - Redistributions of source code must retain the above copyright
*1295d682SXin Li   notice, this list of conditions and the following disclaimer.
*1295d682SXin Li
*1295d682SXin Li   - Redistributions in binary form must reproduce the above copyright
*1295d682SXin Li   notice, this list of conditions and the following disclaimer in the
*1295d682SXin Li   documentation and/or other materials provided with the distribution.
*1295d682SXin Li
*1295d682SXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*1295d682SXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*1295d682SXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*1295d682SXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
*1295d682SXin Li   OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*1295d682SXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*1295d682SXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*1295d682SXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*1295d682SXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*1295d682SXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*1295d682SXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*1295d682SXin Li*/
*1295d682SXin Li
*1295d682SXin Li#ifndef ARCH_H
*1295d682SXin Li#define ARCH_H
*1295d682SXin Li
*1295d682SXin Li#include "opus_types.h"
*1295d682SXin Li#include "common.h"
*1295d682SXin Li
*1295d682SXin Li# if !defined(__GNUC_PREREQ)
*1295d682SXin Li#  if defined(__GNUC__)&&defined(__GNUC_MINOR__)
*1295d682SXin Li#   define __GNUC_PREREQ(_maj,_min) \
*1295d682SXin Li ((__GNUC__<<16)+__GNUC_MINOR__>=((_maj)<<16)+(_min))
*1295d682SXin Li#  else
*1295d682SXin Li#   define __GNUC_PREREQ(_maj,_min) 0
*1295d682SXin Li#  endif
*1295d682SXin Li# endif
*1295d682SXin Li
*1295d682SXin Li#define CELT_SIG_SCALE 32768.f
*1295d682SXin Li
*1295d682SXin Li#define celt_fatal(str) _celt_fatal(str, __FILE__, __LINE__);
*1295d682SXin Li#ifdef ENABLE_ASSERTIONS
*1295d682SXin Li#include <stdio.h>
*1295d682SXin Li#include <stdlib.h>
*1295d682SXin Li#ifdef __GNUC__
*1295d682SXin Li__attribute__((noreturn))
*1295d682SXin Li#endif
*1295d682SXin Listatic OPUS_INLINE void _celt_fatal(const char *str, const char *file, int line)
*1295d682SXin Li{
*1295d682SXin Li   fprintf (stderr, "Fatal (internal) error in %s, line %d: %s\n", file, line, str);
*1295d682SXin Li   abort();
*1295d682SXin Li}
*1295d682SXin Li#define celt_assert(cond) {if (!(cond)) {celt_fatal("assertion failed: " #cond);}}
*1295d682SXin Li#define celt_assert2(cond, message) {if (!(cond)) {celt_fatal("assertion failed: " #cond "\n" message);}}
*1295d682SXin Li#else
*1295d682SXin Li#define celt_assert(cond)
*1295d682SXin Li#define celt_assert2(cond, message)
*1295d682SXin Li#endif
*1295d682SXin Li
*1295d682SXin Li#define IMUL32(a,b) ((a)*(b))
*1295d682SXin Li
*1295d682SXin Li#define MIN16(a,b) ((a) < (b) ? (a) : (b))   /**< Minimum 16-bit value.   */
*1295d682SXin Li#define MAX16(a,b) ((a) > (b) ? (a) : (b))   /**< Maximum 16-bit value.   */
*1295d682SXin Li#define MIN32(a,b) ((a) < (b) ? (a) : (b))   /**< Minimum 32-bit value.   */
*1295d682SXin Li#define MAX32(a,b) ((a) > (b) ? (a) : (b))   /**< Maximum 32-bit value.   */
*1295d682SXin Li#define IMIN(a,b) ((a) < (b) ? (a) : (b))   /**< Minimum int value.   */
*1295d682SXin Li#define IMAX(a,b) ((a) > (b) ? (a) : (b))   /**< Maximum int value.   */
*1295d682SXin Li#define UADD32(a,b) ((a)+(b))
*1295d682SXin Li#define USUB32(a,b) ((a)-(b))
*1295d682SXin Li
*1295d682SXin Li/* Set this if opus_int64 is a native type of the CPU. */
*1295d682SXin Li/* Assume that all LP64 architectures have fast 64-bit types; also x86_64
*1295d682SXin Li   (which can be ILP32 for x32) and Win64 (which is LLP64). */
*1295d682SXin Li#if defined(__x86_64__) || defined(__LP64__) || defined(_WIN64)
*1295d682SXin Li#define OPUS_FAST_INT64 1
*1295d682SXin Li#else
*1295d682SXin Li#define OPUS_FAST_INT64 0
*1295d682SXin Li#endif
*1295d682SXin Li
*1295d682SXin Li#define PRINT_MIPS(file)
*1295d682SXin Li
*1295d682SXin Li#ifdef FIXED_POINT
*1295d682SXin Li
*1295d682SXin Litypedef opus_int16 opus_val16;
*1295d682SXin Litypedef opus_int32 opus_val32;
*1295d682SXin Litypedef opus_int64 opus_val64;
*1295d682SXin Li
*1295d682SXin Litypedef opus_val32 celt_sig;
*1295d682SXin Litypedef opus_val16 celt_norm;
*1295d682SXin Litypedef opus_val32 celt_ener;
*1295d682SXin Li
*1295d682SXin Li#define Q15ONE 32767
*1295d682SXin Li
*1295d682SXin Li#define SIG_SHIFT 12
*1295d682SXin Li/* Safe saturation value for 32-bit signals. Should be less than
*1295d682SXin Li   2^31*(1-0.85) to avoid blowing up on DC at deemphasis.*/
*1295d682SXin Li#define SIG_SAT (300000000)
*1295d682SXin Li
*1295d682SXin Li#define NORM_SCALING 16384
*1295d682SXin Li
*1295d682SXin Li#define DB_SHIFT 10
*1295d682SXin Li
*1295d682SXin Li#define EPSILON 1
*1295d682SXin Li#define VERY_SMALL 0
*1295d682SXin Li#define VERY_LARGE16 ((opus_val16)32767)
*1295d682SXin Li#define Q15_ONE ((opus_val16)32767)
*1295d682SXin Li
*1295d682SXin Li#define SCALEIN(a)      (a)
*1295d682SXin Li#define SCALEOUT(a)     (a)
*1295d682SXin Li
*1295d682SXin Li#define ABS16(x) ((x) < 0 ? (-(x)) : (x))
*1295d682SXin Li#define ABS32(x) ((x) < 0 ? (-(x)) : (x))
*1295d682SXin Li
*1295d682SXin Listatic OPUS_INLINE opus_int16 SAT16(opus_int32 x) {
*1295d682SXin Li   return x > 32767 ? 32767 : x < -32768 ? -32768 : (opus_int16)x;
*1295d682SXin Li}
*1295d682SXin Li
*1295d682SXin Li#ifdef FIXED_DEBUG
*1295d682SXin Li#include "fixed_debug.h"
*1295d682SXin Li#else
*1295d682SXin Li
*1295d682SXin Li#include "fixed_generic.h"
*1295d682SXin Li
*1295d682SXin Li#ifdef OPUS_ARM_PRESUME_AARCH64_NEON_INTR
*1295d682SXin Li#include "arm/fixed_arm64.h"
*1295d682SXin Li#elif OPUS_ARM_INLINE_EDSP
*1295d682SXin Li#include "arm/fixed_armv5e.h"
*1295d682SXin Li#elif defined (OPUS_ARM_INLINE_ASM)
*1295d682SXin Li#include "arm/fixed_armv4.h"
*1295d682SXin Li#elif defined (BFIN_ASM)
*1295d682SXin Li#include "fixed_bfin.h"
*1295d682SXin Li#elif defined (TI_C5X_ASM)
*1295d682SXin Li#include "fixed_c5x.h"
*1295d682SXin Li#elif defined (TI_C6X_ASM)
*1295d682SXin Li#include "fixed_c6x.h"
*1295d682SXin Li#endif
*1295d682SXin Li
*1295d682SXin Li#endif
*1295d682SXin Li
*1295d682SXin Li#else /* FIXED_POINT */
*1295d682SXin Li
*1295d682SXin Litypedef float opus_val16;
*1295d682SXin Litypedef float opus_val32;
*1295d682SXin Litypedef float opus_val64;
*1295d682SXin Li
*1295d682SXin Litypedef float celt_sig;
*1295d682SXin Litypedef float celt_norm;
*1295d682SXin Litypedef float celt_ener;
*1295d682SXin Li
*1295d682SXin Li#ifdef FLOAT_APPROX
*1295d682SXin Li/* This code should reliably detect NaN/inf even when -ffast-math is used.
*1295d682SXin Li   Assumes IEEE 754 format. */
*1295d682SXin Listatic OPUS_INLINE int celt_isnan(float x)
*1295d682SXin Li{
*1295d682SXin Li   union {float f; opus_uint32 i;} in;
*1295d682SXin Li   in.f = x;
*1295d682SXin Li   return ((in.i>>23)&0xFF)==0xFF && (in.i&0x007FFFFF)!=0;
*1295d682SXin Li}
*1295d682SXin Li#else
*1295d682SXin Li#ifdef __FAST_MATH__
*1295d682SXin Li#error Cannot build libopus with -ffast-math unless FLOAT_APPROX is defined. This could result in crashes on extreme (e.g. NaN) input
*1295d682SXin Li#endif
*1295d682SXin Li#define celt_isnan(x) ((x)!=(x))
*1295d682SXin Li#endif
*1295d682SXin Li
*1295d682SXin Li#define Q15ONE 1.0f
*1295d682SXin Li
*1295d682SXin Li#define NORM_SCALING 1.f
*1295d682SXin Li
*1295d682SXin Li#define EPSILON 1e-15f
*1295d682SXin Li#define VERY_SMALL 1e-30f
*1295d682SXin Li#define VERY_LARGE16 1e15f
*1295d682SXin Li#define Q15_ONE ((opus_val16)1.f)
*1295d682SXin Li
*1295d682SXin Li/* This appears to be the same speed as C99's fabsf() but it's more portable. */
*1295d682SXin Li#define ABS16(x) ((float)fabs(x))
*1295d682SXin Li#define ABS32(x) ((float)fabs(x))
*1295d682SXin Li
*1295d682SXin Li#define QCONST16(x,bits) (x)
*1295d682SXin Li#define QCONST32(x,bits) (x)
*1295d682SXin Li
*1295d682SXin Li#define NEG16(x) (-(x))
*1295d682SXin Li#define NEG32(x) (-(x))
*1295d682SXin Li#define NEG32_ovflw(x) (-(x))
*1295d682SXin Li#define EXTRACT16(x) (x)
*1295d682SXin Li#define EXTEND32(x) (x)
*1295d682SXin Li#define SHR16(a,shift) (a)
*1295d682SXin Li#define SHL16(a,shift) (a)
*1295d682SXin Li#define SHR32(a,shift) (a)
*1295d682SXin Li#define SHL32(a,shift) (a)
*1295d682SXin Li#define PSHR32(a,shift) (a)
*1295d682SXin Li#define VSHR32(a,shift) (a)
*1295d682SXin Li
*1295d682SXin Li#define PSHR(a,shift)   (a)
*1295d682SXin Li#define SHR(a,shift)    (a)
*1295d682SXin Li#define SHL(a,shift)    (a)
*1295d682SXin Li#define SATURATE(x,a)   (x)
*1295d682SXin Li#define SATURATE16(x)   (x)
*1295d682SXin Li
*1295d682SXin Li#define ROUND16(a,shift)  (a)
*1295d682SXin Li#define SROUND16(a,shift) (a)
*1295d682SXin Li#define HALF16(x)       (.5f*(x))
*1295d682SXin Li#define HALF32(x)       (.5f*(x))
*1295d682SXin Li
*1295d682SXin Li#define ADD16(a,b) ((a)+(b))
*1295d682SXin Li#define SUB16(a,b) ((a)-(b))
*1295d682SXin Li#define ADD32(a,b) ((a)+(b))
*1295d682SXin Li#define SUB32(a,b) ((a)-(b))
*1295d682SXin Li#define ADD32_ovflw(a,b) ((a)+(b))
*1295d682SXin Li#define SUB32_ovflw(a,b) ((a)-(b))
*1295d682SXin Li#define MULT16_16_16(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_16(a,b)     ((opus_val32)(a)*(opus_val32)(b))
*1295d682SXin Li#define MAC16_16(c,a,b)     ((c)+(opus_val32)(a)*(opus_val32)(b))
*1295d682SXin Li
*1295d682SXin Li#define MULT16_32_Q15(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_32_Q16(a,b)     ((a)*(b))
*1295d682SXin Li
*1295d682SXin Li#define MULT32_32_Q31(a,b)     ((a)*(b))
*1295d682SXin Li
*1295d682SXin Li#define MAC16_32_Q15(c,a,b)     ((c)+(a)*(b))
*1295d682SXin Li#define MAC16_32_Q16(c,a,b)     ((c)+(a)*(b))
*1295d682SXin Li
*1295d682SXin Li#define MULT16_16_Q11_32(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_16_Q11(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_16_Q13(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_16_Q14(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_16_Q15(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_16_P15(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_16_P13(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_16_P14(a,b)     ((a)*(b))
*1295d682SXin Li#define MULT16_32_P16(a,b)     ((a)*(b))
*1295d682SXin Li
*1295d682SXin Li#define DIV32_16(a,b)     (((opus_val32)(a))/(opus_val16)(b))
*1295d682SXin Li#define DIV32(a,b)     (((opus_val32)(a))/(opus_val32)(b))
*1295d682SXin Li
*1295d682SXin Li#define SCALEIN(a)      ((a)*CELT_SIG_SCALE)
*1295d682SXin Li#define SCALEOUT(a)     ((a)*(1/CELT_SIG_SCALE))
*1295d682SXin Li
*1295d682SXin Li#define SIG2WORD16(x) (x)
*1295d682SXin Li
*1295d682SXin Li#endif /* !FIXED_POINT */
*1295d682SXin Li
*1295d682SXin Li#ifndef GLOBAL_STACK_SIZE
*1295d682SXin Li#ifdef FIXED_POINT
*1295d682SXin Li#define GLOBAL_STACK_SIZE 120000
*1295d682SXin Li#else
*1295d682SXin Li#define GLOBAL_STACK_SIZE 120000
*1295d682SXin Li#endif
*1295d682SXin Li#endif
*1295d682SXin Li
*1295d682SXin Li#endif /* ARCH_H */