libopus/celt/arch.h

*a58d3d2aSXin Li/* Copyright (c) 2003-2008 Jean-Marc Valin
*a58d3d2aSXin Li   Copyright (c) 2007-2008 CSIRO
*a58d3d2aSXin Li   Copyright (c) 2007-2009 Xiph.Org Foundation
*a58d3d2aSXin Li   Written by Jean-Marc Valin */
*a58d3d2aSXin Li/**
*a58d3d2aSXin Li   @file arch.h
*a58d3d2aSXin Li   @brief Various architecture definitions for CELT
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
*a58d3d2aSXin Li   OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef ARCH_H
*a58d3d2aSXin Li#define ARCH_H
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "opus_types.h"
*a58d3d2aSXin Li#include "opus_defines.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li# if !defined(__GNUC_PREREQ)
*a58d3d2aSXin Li#  if defined(__GNUC__)&&defined(__GNUC_MINOR__)
*a58d3d2aSXin Li#   define __GNUC_PREREQ(_maj,_min) \
*a58d3d2aSXin Li ((__GNUC__<<16)+__GNUC_MINOR__>=((_maj)<<16)+(_min))
*a58d3d2aSXin Li#  else
*a58d3d2aSXin Li#   define __GNUC_PREREQ(_maj,_min) 0
*a58d3d2aSXin Li#  endif
*a58d3d2aSXin Li# endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if OPUS_GNUC_PREREQ(3, 0)
*a58d3d2aSXin Li#define opus_likely(x)       (__builtin_expect(!!(x), 1))
*a58d3d2aSXin Li#define opus_unlikely(x)     (__builtin_expect(!!(x), 0))
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define opus_likely(x)       (!!(x))
*a58d3d2aSXin Li#define opus_unlikely(x)     (!!(x))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define CELT_SIG_SCALE 32768.f
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define CELT_FATAL(str) celt_fatal(str, __FILE__, __LINE__);
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if defined(ENABLE_ASSERTIONS) || defined(ENABLE_HARDENING)
*a58d3d2aSXin Li#ifdef __GNUC__
*a58d3d2aSXin Li__attribute__((noreturn))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Livoid celt_fatal(const char *str, const char *file, int line);
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if defined(CELT_C) && !defined(OVERRIDE_celt_fatal)
*a58d3d2aSXin Li#include <stdio.h>
*a58d3d2aSXin Li#include <stdlib.h>
*a58d3d2aSXin Li#ifdef __GNUC__
*a58d3d2aSXin Li__attribute__((noreturn))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Livoid celt_fatal(const char *str, const char *file, int line)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   fprintf (stderr, "Fatal (internal) error in %s, line %d: %s\n", file, line, str);
*a58d3d2aSXin Li#if defined(_MSC_VER)
*a58d3d2aSXin Li   _set_abort_behavior( 0, _WRITE_ABORT_MSG);
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li   abort();
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define celt_assert(cond) {if (!(cond)) {CELT_FATAL("assertion failed: " #cond);}}
*a58d3d2aSXin Li#define celt_assert2(cond, message) {if (!(cond)) {CELT_FATAL("assertion failed: " #cond "\n" message);}}
*a58d3d2aSXin Li#define MUST_SUCCEED(call) celt_assert((call) == OPUS_OK)
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define celt_assert(cond)
*a58d3d2aSXin Li#define celt_assert2(cond, message)
*a58d3d2aSXin Li#define MUST_SUCCEED(call) do {if((call) != OPUS_OK) {RESTORE_STACK; return OPUS_INTERNAL_ERROR;} } while (0)
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if defined(ENABLE_ASSERTIONS)
*a58d3d2aSXin Li#define celt_sig_assert(cond) {if (!(cond)) {CELT_FATAL("signal assertion failed: " #cond);}}
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define celt_sig_assert(cond)
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define IMUL32(a,b) ((a)*(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MIN16(a,b) ((a) < (b) ? (a) : (b))   /**< Minimum 16-bit value.   */
*a58d3d2aSXin Li#define MAX16(a,b) ((a) > (b) ? (a) : (b))   /**< Maximum 16-bit value.   */
*a58d3d2aSXin Li#define MIN32(a,b) ((a) < (b) ? (a) : (b))   /**< Minimum 32-bit value.   */
*a58d3d2aSXin Li#define MAX32(a,b) ((a) > (b) ? (a) : (b))   /**< Maximum 32-bit value.   */
*a58d3d2aSXin Li#define IMIN(a,b) ((a) < (b) ? (a) : (b))   /**< Minimum int value.   */
*a58d3d2aSXin Li#define IMAX(a,b) ((a) > (b) ? (a) : (b))   /**< Maximum int value.   */
*a58d3d2aSXin Li#define UADD32(a,b) ((a)+(b))
*a58d3d2aSXin Li#define USUB32(a,b) ((a)-(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Set this if opus_int64 is a native type of the CPU. */
*a58d3d2aSXin Li/* Assume that all LP64 architectures have fast 64-bit types; also x86_64
*a58d3d2aSXin Li   (which can be ILP32 for x32) and Win64 (which is LLP64). */
*a58d3d2aSXin Li#if defined(__x86_64__) || defined(__LP64__) || defined(_WIN64)
*a58d3d2aSXin Li#define OPUS_FAST_INT64 1
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define OPUS_FAST_INT64 0
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define PRINT_MIPS(file)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li
*a58d3d2aSXin Litypedef opus_int16 opus_val16;
*a58d3d2aSXin Litypedef opus_int32 opus_val32;
*a58d3d2aSXin Litypedef opus_int64 opus_val64;
*a58d3d2aSXin Li
*a58d3d2aSXin Litypedef opus_val32 celt_sig;
*a58d3d2aSXin Litypedef opus_val16 celt_norm;
*a58d3d2aSXin Litypedef opus_val32 celt_ener;
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define celt_isnan(x) 0
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define Q15ONE 32767
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define SIG_SHIFT 12
*a58d3d2aSXin Li/* Safe saturation value for 32-bit signals. Should be less than
*a58d3d2aSXin Li   2^31*(1-0.85) to avoid blowing up on DC at deemphasis.*/
*a58d3d2aSXin Li#define SIG_SAT (300000000)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define NORM_SCALING 16384
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define DB_SHIFT 10
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define EPSILON 1
*a58d3d2aSXin Li#define VERY_SMALL 0
*a58d3d2aSXin Li#define VERY_LARGE16 ((opus_val16)32767)
*a58d3d2aSXin Li#define Q15_ONE ((opus_val16)32767)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define SCALEIN(a)      (a)
*a58d3d2aSXin Li#define SCALEOUT(a)     (a)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define ABS16(x) ((x) < 0 ? (-(x)) : (x))
*a58d3d2aSXin Li#define ABS32(x) ((x) < 0 ? (-(x)) : (x))
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic OPUS_INLINE opus_int16 SAT16(opus_int32 x) {
*a58d3d2aSXin Li   return x > 32767 ? 32767 : x < -32768 ? -32768 : (opus_int16)x;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FIXED_DEBUG
*a58d3d2aSXin Li#include "fixed_debug.h"
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "fixed_generic.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef OPUS_ARM_PRESUME_AARCH64_NEON_INTR
*a58d3d2aSXin Li#include "arm/fixed_arm64.h"
*a58d3d2aSXin Li#elif defined (OPUS_ARM_INLINE_EDSP)
*a58d3d2aSXin Li#include "arm/fixed_armv5e.h"
*a58d3d2aSXin Li#elif defined (OPUS_ARM_INLINE_ASM)
*a58d3d2aSXin Li#include "arm/fixed_armv4.h"
*a58d3d2aSXin Li#elif defined (BFIN_ASM)
*a58d3d2aSXin Li#include "fixed_bfin.h"
*a58d3d2aSXin Li#elif defined (TI_C5X_ASM)
*a58d3d2aSXin Li#include "fixed_c5x.h"
*a58d3d2aSXin Li#elif defined (TI_C6X_ASM)
*a58d3d2aSXin Li#include "fixed_c6x.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#else /* FIXED_POINT */
*a58d3d2aSXin Li
*a58d3d2aSXin Litypedef float opus_val16;
*a58d3d2aSXin Litypedef float opus_val32;
*a58d3d2aSXin Litypedef float opus_val64;
*a58d3d2aSXin Li
*a58d3d2aSXin Litypedef float celt_sig;
*a58d3d2aSXin Litypedef float celt_norm;
*a58d3d2aSXin Litypedef float celt_ener;
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FLOAT_APPROX
*a58d3d2aSXin Li/* This code should reliably detect NaN/inf even when -ffast-math is used.
*a58d3d2aSXin Li   Assumes IEEE 754 format. */
*a58d3d2aSXin Listatic OPUS_INLINE int celt_isnan(float x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   union {float f; opus_uint32 i;} in;
*a58d3d2aSXin Li   in.f = x;
*a58d3d2aSXin Li   return ((in.i>>23)&0xFF)==0xFF && (in.i&0x007FFFFF)!=0;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#ifdef __FAST_MATH__
*a58d3d2aSXin Li#error Cannot build libopus with -ffast-math unless FLOAT_APPROX is defined. This could result in crashes on extreme (e.g. NaN) input
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#define celt_isnan(x) ((x)!=(x))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define Q15ONE 1.0f
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define NORM_SCALING 1.f
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define EPSILON 1e-15f
*a58d3d2aSXin Li#define VERY_SMALL 1e-30f
*a58d3d2aSXin Li#define VERY_LARGE16 1e15f
*a58d3d2aSXin Li#define Q15_ONE ((opus_val16)1.f)
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* This appears to be the same speed as C99's fabsf() but it's more portable. */
*a58d3d2aSXin Li#define ABS16(x) ((float)fabs(x))
*a58d3d2aSXin Li#define ABS32(x) ((float)fabs(x))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define QCONST16(x,bits) (x)
*a58d3d2aSXin Li#define QCONST32(x,bits) (x)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define NEG16(x) (-(x))
*a58d3d2aSXin Li#define NEG32(x) (-(x))
*a58d3d2aSXin Li#define NEG32_ovflw(x) (-(x))
*a58d3d2aSXin Li#define EXTRACT16(x) (x)
*a58d3d2aSXin Li#define EXTEND32(x) (x)
*a58d3d2aSXin Li#define SHR16(a,shift) (a)
*a58d3d2aSXin Li#define SHL16(a,shift) (a)
*a58d3d2aSXin Li#define SHR32(a,shift) (a)
*a58d3d2aSXin Li#define SHL32(a,shift) (a)
*a58d3d2aSXin Li#define PSHR32(a,shift) (a)
*a58d3d2aSXin Li#define VSHR32(a,shift) (a)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define PSHR(a,shift)   (a)
*a58d3d2aSXin Li#define SHR(a,shift)    (a)
*a58d3d2aSXin Li#define SHL(a,shift)    (a)
*a58d3d2aSXin Li#define SATURATE(x,a)   (x)
*a58d3d2aSXin Li#define SATURATE16(x)   (x)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define ROUND16(a,shift)  (a)
*a58d3d2aSXin Li#define SROUND16(a,shift) (a)
*a58d3d2aSXin Li#define HALF16(x)       (.5f*(x))
*a58d3d2aSXin Li#define HALF32(x)       (.5f*(x))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define ADD16(a,b) ((a)+(b))
*a58d3d2aSXin Li#define SUB16(a,b) ((a)-(b))
*a58d3d2aSXin Li#define ADD32(a,b) ((a)+(b))
*a58d3d2aSXin Li#define SUB32(a,b) ((a)-(b))
*a58d3d2aSXin Li#define ADD32_ovflw(a,b) ((a)+(b))
*a58d3d2aSXin Li#define SUB32_ovflw(a,b) ((a)-(b))
*a58d3d2aSXin Li#define MULT16_16_16(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_16(a,b)     ((opus_val32)(a)*(opus_val32)(b))
*a58d3d2aSXin Li#define MAC16_16(c,a,b)     ((c)+(opus_val32)(a)*(opus_val32)(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MULT16_32_Q15(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_32_Q16(a,b)     ((a)*(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MULT32_32_Q31(a,b)     ((a)*(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MAC16_32_Q15(c,a,b)     ((c)+(a)*(b))
*a58d3d2aSXin Li#define MAC16_32_Q16(c,a,b)     ((c)+(a)*(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MULT16_16_Q11_32(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_16_Q11(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_16_Q13(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_16_Q14(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_16_Q15(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_16_P15(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_16_P13(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_16_P14(a,b)     ((a)*(b))
*a58d3d2aSXin Li#define MULT16_32_P16(a,b)     ((a)*(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define DIV32_16(a,b)     (((opus_val32)(a))/(opus_val16)(b))
*a58d3d2aSXin Li#define DIV32(a,b)     (((opus_val32)(a))/(opus_val32)(b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define SCALEIN(a)      ((a)*CELT_SIG_SCALE)
*a58d3d2aSXin Li#define SCALEOUT(a)     ((a)*(1/CELT_SIG_SCALE))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define SIG2WORD16(x) (x)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#endif /* !FIXED_POINT */
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef GLOBAL_STACK_SIZE
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li#define GLOBAL_STACK_SIZE 120000
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define GLOBAL_STACK_SIZE 120000
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#endif /* ARCH_H */