libopus/silk/SigProc_FIX.h

*a58d3d2aSXin Li/***********************************************************************
*a58d3d2aSXin LiCopyright (c) 2006-2011, Skype Limited. All rights reserved.
*a58d3d2aSXin LiRedistribution and use in source and binary forms, with or without
*a58d3d2aSXin Limodification, are permitted provided that the following conditions
*a58d3d2aSXin Liare met:
*a58d3d2aSXin Li- Redistributions of source code must retain the above copyright notice,
*a58d3d2aSXin Lithis list of conditions and the following disclaimer.
*a58d3d2aSXin Li- Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Linotice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Lidocumentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li- Neither the name of Internet Society, IETF or IETF Trust, nor the
*a58d3d2aSXin Linames of specific contributors, may be used to endorse or promote
*a58d3d2aSXin Liproducts derived from this software without specific prior written
*a58d3d2aSXin Lipermission.
*a58d3d2aSXin LiTHIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
*a58d3d2aSXin LiAND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
*a58d3d2aSXin LiIMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
*a58d3d2aSXin LiARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
*a58d3d2aSXin LiLIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
*a58d3d2aSXin LiCONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
*a58d3d2aSXin LiSUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
*a58d3d2aSXin LiINTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
*a58d3d2aSXin LiCONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
*a58d3d2aSXin LiARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
*a58d3d2aSXin LiPOSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li***********************************************************************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef SILK_SIGPROC_FIX_H
*a58d3d2aSXin Li#define SILK_SIGPROC_FIX_H
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef  __cplusplus
*a58d3d2aSXin Liextern "C"
*a58d3d2aSXin Li{
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*#define silk_MACRO_COUNT */          /* Used to enable WMOPS counting */
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define SILK_MAX_ORDER_LPC            24            /* max order of the LPC analysis in schur() and k2a() */
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include <string.h>                                 /* for memset(), memcpy(), memmove() */
*a58d3d2aSXin Li#include "typedef.h"
*a58d3d2aSXin Li#include "resampler_structs.h"
*a58d3d2aSXin Li#include "macros.h"
*a58d3d2aSXin Li#include "cpu_support.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if defined(OPUS_X86_MAY_HAVE_SSE4_1)
*a58d3d2aSXin Li#include "x86/SigProc_FIX_sse.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if (defined(OPUS_ARM_ASM) || defined(OPUS_ARM_MAY_HAVE_NEON_INTR))
*a58d3d2aSXin Li#include "arm/biquad_alt_arm.h"
*a58d3d2aSXin Li#include "arm/LPC_inv_pred_gain_arm.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/********************************************************************/
*a58d3d2aSXin Li/*                    SIGNAL PROCESSING FUNCTIONS                   */
*a58d3d2aSXin Li/********************************************************************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*!
*a58d3d2aSXin Li * Initialize/reset the resampler state for a given pair of input/output sampling rates
*a58d3d2aSXin Li*/
*a58d3d2aSXin Liopus_int silk_resampler_init(
*a58d3d2aSXin Li    silk_resampler_state_struct *S,                 /* I/O  Resampler state                                             */
*a58d3d2aSXin Li    opus_int32                  Fs_Hz_in,           /* I    Input sampling rate (Hz)                                    */
*a58d3d2aSXin Li    opus_int32                  Fs_Hz_out,          /* I    Output sampling rate (Hz)                                   */
*a58d3d2aSXin Li    opus_int                    forEnc              /* I    If 1: encoder; if 0: decoder                                */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*!
*a58d3d2aSXin Li * Resampler: convert from one sampling rate to another
*a58d3d2aSXin Li */
*a58d3d2aSXin Liopus_int silk_resampler(
*a58d3d2aSXin Li    silk_resampler_state_struct *S,                 /* I/O  Resampler state                                             */
*a58d3d2aSXin Li    opus_int16                  out[],              /* O    Output signal                                               */
*a58d3d2aSXin Li    const opus_int16            in[],               /* I    Input signal                                                */
*a58d3d2aSXin Li    opus_int32                  inLen               /* I    Number of input samples                                     */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*!
*a58d3d2aSXin Li* Downsample 2x, mediocre quality
*a58d3d2aSXin Li*/
*a58d3d2aSXin Livoid silk_resampler_down2(
*a58d3d2aSXin Li    opus_int32                  *S,                 /* I/O  State vector [ 2 ]                                          */
*a58d3d2aSXin Li    opus_int16                  *out,               /* O    Output signal [ len ]                                       */
*a58d3d2aSXin Li    const opus_int16            *in,                /* I    Input signal [ floor(len/2) ]                               */
*a58d3d2aSXin Li    opus_int32                  inLen               /* I    Number of input samples                                     */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*!
*a58d3d2aSXin Li * Downsample by a factor 2/3, low quality
*a58d3d2aSXin Li*/
*a58d3d2aSXin Livoid silk_resampler_down2_3(
*a58d3d2aSXin Li    opus_int32                  *S,                 /* I/O  State vector [ 6 ]                                          */
*a58d3d2aSXin Li    opus_int16                  *out,               /* O    Output signal [ floor(2*inLen/3) ]                          */
*a58d3d2aSXin Li    const opus_int16            *in,                /* I    Input signal [ inLen ]                                      */
*a58d3d2aSXin Li    opus_int32                  inLen               /* I    Number of input samples                                     */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*!
*a58d3d2aSXin Li * second order ARMA filter;
*a58d3d2aSXin Li * slower than biquad() but uses more precise coefficients
*a58d3d2aSXin Li * can handle (slowly) varying coefficients
*a58d3d2aSXin Li */
*a58d3d2aSXin Livoid silk_biquad_alt_stride1(
*a58d3d2aSXin Li    const opus_int16            *in,                /* I     input signal                                               */
*a58d3d2aSXin Li    const opus_int32            *B_Q28,             /* I     MA coefficients [3]                                        */
*a58d3d2aSXin Li    const opus_int32            *A_Q28,             /* I     AR coefficients [2]                                        */
*a58d3d2aSXin Li    opus_int32                  *S,                 /* I/O   State vector [2]                                           */
*a58d3d2aSXin Li    opus_int16                  *out,               /* O     output signal                                              */
*a58d3d2aSXin Li    const opus_int32            len                 /* I     signal length (must be even)                               */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid silk_biquad_alt_stride2_c(
*a58d3d2aSXin Li    const opus_int16            *in,                /* I     input signal                                               */
*a58d3d2aSXin Li    const opus_int32            *B_Q28,             /* I     MA coefficients [3]                                        */
*a58d3d2aSXin Li    const opus_int32            *A_Q28,             /* I     AR coefficients [2]                                        */
*a58d3d2aSXin Li    opus_int32                  *S,                 /* I/O   State vector [4]                                           */
*a58d3d2aSXin Li    opus_int16                  *out,               /* O     output signal                                              */
*a58d3d2aSXin Li    const opus_int32            len                 /* I     signal length (must be even)                               */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Variable order MA prediction error filter. */
*a58d3d2aSXin Livoid silk_LPC_analysis_filter(
*a58d3d2aSXin Li    opus_int16                  *out,               /* O    Output signal                                               */
*a58d3d2aSXin Li    const opus_int16            *in,                /* I    Input signal                                                */
*a58d3d2aSXin Li    const opus_int16            *B,                 /* I    MA prediction coefficients, Q12 [order]                     */
*a58d3d2aSXin Li    const opus_int32            len,                /* I    Signal length                                               */
*a58d3d2aSXin Li    const opus_int32            d,                  /* I    Filter order                                                */
*a58d3d2aSXin Li    int                         arch                /* I    Run-time architecture                                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Chirp (bandwidth expand) LP AR filter */
*a58d3d2aSXin Livoid silk_bwexpander(
*a58d3d2aSXin Li    opus_int16                  *ar,                /* I/O  AR filter to be expanded (without leading 1)                */
*a58d3d2aSXin Li    const opus_int              d,                  /* I    Length of ar                                                */
*a58d3d2aSXin Li    opus_int32                  chirp_Q16           /* I    Chirp factor (typically in the range 0 to 1)                */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Chirp (bandwidth expand) LP AR filter */
*a58d3d2aSXin Livoid silk_bwexpander_32(
*a58d3d2aSXin Li    opus_int32                  *ar,                /* I/O  AR filter to be expanded (without leading 1)                */
*a58d3d2aSXin Li    const opus_int              d,                  /* I    Length of ar                                                */
*a58d3d2aSXin Li    opus_int32                  chirp_Q16           /* I    Chirp factor in Q16                                         */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Compute inverse of LPC prediction gain, and                           */
*a58d3d2aSXin Li/* test if LPC coefficients are stable (all poles within unit circle)    */
*a58d3d2aSXin Liopus_int32 silk_LPC_inverse_pred_gain_c(            /* O   Returns inverse prediction gain in energy domain, Q30        */
*a58d3d2aSXin Li    const opus_int16            *A_Q12,             /* I   Prediction coefficients, Q12 [order]                         */
*a58d3d2aSXin Li    const opus_int              order               /* I   Prediction order                                             */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Split signal in two decimated bands using first-order allpass filters */
*a58d3d2aSXin Livoid silk_ana_filt_bank_1(
*a58d3d2aSXin Li    const opus_int16            *in,                /* I    Input signal [N]                                            */
*a58d3d2aSXin Li    opus_int32                  *S,                 /* I/O  State vector [2]                                            */
*a58d3d2aSXin Li    opus_int16                  *outL,              /* O    Low band [N/2]                                              */
*a58d3d2aSXin Li    opus_int16                  *outH,              /* O    High band [N/2]                                             */
*a58d3d2aSXin Li    const opus_int32            N                   /* I    Number of input samples                                     */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if !defined(OVERRIDE_silk_biquad_alt_stride2)
*a58d3d2aSXin Li#define silk_biquad_alt_stride2(in, B_Q28, A_Q28, S, out, len, arch) ((void)(arch), silk_biquad_alt_stride2_c(in, B_Q28, A_Q28, S, out, len))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if !defined(OVERRIDE_silk_LPC_inverse_pred_gain)
*a58d3d2aSXin Li#define silk_LPC_inverse_pred_gain(A_Q12, order, arch)     ((void)(arch), silk_LPC_inverse_pred_gain_c(A_Q12, order))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/********************************************************************/
*a58d3d2aSXin Li/*                        SCALAR FUNCTIONS                          */
*a58d3d2aSXin Li/********************************************************************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Approximation of 128 * log2() (exact inverse of approx 2^() below) */
*a58d3d2aSXin Li/* Convert input to a log scale    */
*a58d3d2aSXin Liopus_int32 silk_lin2log(
*a58d3d2aSXin Li    const opus_int32            inLin               /* I  input in linear scale                                         */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Approximation of a sigmoid function */
*a58d3d2aSXin Liopus_int silk_sigm_Q15(
*a58d3d2aSXin Li    opus_int                    in_Q5               /* I                                                                */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Approximation of 2^() (exact inverse of approx log2() above) */
*a58d3d2aSXin Li/* Convert input to a linear scale */
*a58d3d2aSXin Liopus_int32 silk_log2lin(
*a58d3d2aSXin Li    const opus_int32            inLog_Q7            /* I  input on log scale                                            */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Compute number of bits to right shift the sum of squares of a vector    */
*a58d3d2aSXin Li/* of int16s to make it fit in an int32                                    */
*a58d3d2aSXin Livoid silk_sum_sqr_shift(
*a58d3d2aSXin Li    opus_int32                  *energy,            /* O   Energy of x, after shifting to the right                     */
*a58d3d2aSXin Li    opus_int                    *shift,             /* O   Number of bits right shift applied to energy                 */
*a58d3d2aSXin Li    const opus_int16            *x,                 /* I   Input vector                                                 */
*a58d3d2aSXin Li    opus_int                    len                 /* I   Length of input vector                                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Calculates the reflection coefficients from the correlation sequence    */
*a58d3d2aSXin Li/* Faster than schur64(), but much less accurate.                          */
*a58d3d2aSXin Li/* uses SMLAWB(), requiring armv5E and higher.                             */
*a58d3d2aSXin Liopus_int32 silk_schur(                              /* O    Returns residual energy                                     */
*a58d3d2aSXin Li    opus_int16                  *rc_Q15,            /* O    reflection coefficients [order] Q15                         */
*a58d3d2aSXin Li    const opus_int32            *c,                 /* I    correlations [order+1]                                      */
*a58d3d2aSXin Li    const opus_int32            order               /* I    prediction order                                            */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Calculates the reflection coefficients from the correlation sequence    */
*a58d3d2aSXin Li/* Slower than schur(), but more accurate.                                 */
*a58d3d2aSXin Li/* Uses SMULL(), available on armv4                                        */
*a58d3d2aSXin Liopus_int32 silk_schur64(                            /* O    returns residual energy                                     */
*a58d3d2aSXin Li    opus_int32                  rc_Q16[],           /* O    Reflection coefficients [order] Q16                         */
*a58d3d2aSXin Li    const opus_int32            c[],                /* I    Correlations [order+1]                                      */
*a58d3d2aSXin Li    opus_int32                  order               /* I    Prediction order                                            */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Step up function, converts reflection coefficients to prediction coefficients */
*a58d3d2aSXin Livoid silk_k2a(
*a58d3d2aSXin Li    opus_int32                  *A_Q24,             /* O    Prediction coefficients [order] Q24                         */
*a58d3d2aSXin Li    const opus_int16            *rc_Q15,            /* I    Reflection coefficients [order] Q15                         */
*a58d3d2aSXin Li    const opus_int32            order               /* I    Prediction order                                            */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Step up function, converts reflection coefficients to prediction coefficients */
*a58d3d2aSXin Livoid silk_k2a_Q16(
*a58d3d2aSXin Li    opus_int32                  *A_Q24,             /* O    Prediction coefficients [order] Q24                         */
*a58d3d2aSXin Li    const opus_int32            *rc_Q16,            /* I    Reflection coefficients [order] Q16                         */
*a58d3d2aSXin Li    const opus_int32            order               /* I    Prediction order                                            */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Apply sine window to signal vector.                              */
*a58d3d2aSXin Li/* Window types:                                                    */
*a58d3d2aSXin Li/*    1 -> sine window from 0 to pi/2                               */
*a58d3d2aSXin Li/*    2 -> sine window from pi/2 to pi                              */
*a58d3d2aSXin Li/* every other sample of window is linearly interpolated, for speed */
*a58d3d2aSXin Livoid silk_apply_sine_window(
*a58d3d2aSXin Li    opus_int16                  px_win[],           /* O    Pointer to windowed signal                                  */
*a58d3d2aSXin Li    const opus_int16            px[],               /* I    Pointer to input signal                                     */
*a58d3d2aSXin Li    const opus_int              win_type,           /* I    Selects a window type                                       */
*a58d3d2aSXin Li    const opus_int              length              /* I    Window length, multiple of 4                                */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Compute autocorrelation */
*a58d3d2aSXin Livoid silk_autocorr(
*a58d3d2aSXin Li    opus_int32                  *results,           /* O    Result (length correlationCount)                            */
*a58d3d2aSXin Li    opus_int                    *scale,             /* O    Scaling of the correlation vector                           */
*a58d3d2aSXin Li    const opus_int16            *inputData,         /* I    Input data to correlate                                     */
*a58d3d2aSXin Li    const opus_int              inputDataSize,      /* I    Length of input                                             */
*a58d3d2aSXin Li    const opus_int              correlationCount,   /* I    Number of correlation taps to compute                       */
*a58d3d2aSXin Li    int                         arch                /* I    Run-time architecture                                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid silk_decode_pitch(
*a58d3d2aSXin Li    opus_int16                  lagIndex,           /* I                                                                */
*a58d3d2aSXin Li    opus_int8                   contourIndex,       /* O                                                                */
*a58d3d2aSXin Li    opus_int                    pitch_lags[],       /* O    4 pitch values                                              */
*a58d3d2aSXin Li    const opus_int              Fs_kHz,             /* I    sampling frequency (kHz)                                    */
*a58d3d2aSXin Li    const opus_int              nb_subfr            /* I    number of sub frames                                        */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_int silk_pitch_analysis_core(                  /* O    Voicing estimate: 0 voiced, 1 unvoiced                      */
*a58d3d2aSXin Li    const opus_int16            *frame,             /* I    Signal of length PE_FRAME_LENGTH_MS*Fs_kHz                  */
*a58d3d2aSXin Li    opus_int                    *pitch_out,         /* O    4 pitch lag values                                          */
*a58d3d2aSXin Li    opus_int16                  *lagIndex,          /* O    Lag Index                                                   */
*a58d3d2aSXin Li    opus_int8                   *contourIndex,      /* O    Pitch contour Index                                         */
*a58d3d2aSXin Li    opus_int                    *LTPCorr_Q15,       /* I/O  Normalized correlation; input: value from previous frame    */
*a58d3d2aSXin Li    opus_int                    prevLag,            /* I    Last lag of previous frame; set to zero is unvoiced         */
*a58d3d2aSXin Li    const opus_int32            search_thres1_Q16,  /* I    First stage threshold for lag candidates 0 - 1              */
*a58d3d2aSXin Li    const opus_int              search_thres2_Q13,  /* I    Final threshold for lag candidates 0 - 1                    */
*a58d3d2aSXin Li    const opus_int              Fs_kHz,             /* I    Sample frequency (kHz)                                      */
*a58d3d2aSXin Li    const opus_int              complexity,         /* I    Complexity setting, 0-2, where 2 is highest                 */
*a58d3d2aSXin Li    const opus_int              nb_subfr,           /* I    number of 5 ms subframes                                    */
*a58d3d2aSXin Li    int                         arch                /* I    Run-time architecture                                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Compute Normalized Line Spectral Frequencies (NLSFs) from whitening filter coefficients      */
*a58d3d2aSXin Li/* If not all roots are found, the a_Q16 coefficients are bandwidth expanded until convergence. */
*a58d3d2aSXin Livoid silk_A2NLSF(
*a58d3d2aSXin Li    opus_int16                  *NLSF,              /* O    Normalized Line Spectral Frequencies in Q15 (0..2^15-1) [d] */
*a58d3d2aSXin Li    opus_int32                  *a_Q16,             /* I/O  Monic whitening filter coefficients in Q16 [d]              */
*a58d3d2aSXin Li    const opus_int              d                   /* I    Filter order (must be even)                                 */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* compute whitening filter coefficients from normalized line spectral frequencies */
*a58d3d2aSXin Livoid silk_NLSF2A(
*a58d3d2aSXin Li    opus_int16                  *a_Q12,             /* O    monic whitening filter coefficients in Q12,  [ d ]          */
*a58d3d2aSXin Li    const opus_int16            *NLSF,              /* I    normalized line spectral frequencies in Q15, [ d ]          */
*a58d3d2aSXin Li    const opus_int              d,                  /* I    filter order (should be even)                               */
*a58d3d2aSXin Li    int                         arch                /* I    Run-time architecture                                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Convert int32 coefficients to int16 coefs and make sure there's no wrap-around */
*a58d3d2aSXin Livoid silk_LPC_fit(
*a58d3d2aSXin Li    opus_int16                  *a_QOUT,            /* O    Output signal                                               */
*a58d3d2aSXin Li    opus_int32                  *a_QIN,             /* I/O  Input signal                                                */
*a58d3d2aSXin Li    const opus_int              QOUT,               /* I    Input Q domain                                              */
*a58d3d2aSXin Li    const opus_int              QIN,                /* I    Input Q domain                                              */
*a58d3d2aSXin Li    const opus_int              d                   /* I    Filter order                                                */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid silk_insertion_sort_increasing(
*a58d3d2aSXin Li    opus_int32                  *a,                 /* I/O   Unsorted / Sorted vector                                   */
*a58d3d2aSXin Li    opus_int                    *idx,               /* O     Index vector for the sorted elements                       */
*a58d3d2aSXin Li    const opus_int              L,                  /* I     Vector length                                              */
*a58d3d2aSXin Li    const opus_int              K                   /* I     Number of correctly sorted positions                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid silk_insertion_sort_decreasing_int16(
*a58d3d2aSXin Li    opus_int16                  *a,                 /* I/O   Unsorted / Sorted vector                                   */
*a58d3d2aSXin Li    opus_int                    *idx,               /* O     Index vector for the sorted elements                       */
*a58d3d2aSXin Li    const opus_int              L,                  /* I     Vector length                                              */
*a58d3d2aSXin Li    const opus_int              K                   /* I     Number of correctly sorted positions                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid silk_insertion_sort_increasing_all_values_int16(
*a58d3d2aSXin Li     opus_int16                 *a,                 /* I/O   Unsorted / Sorted vector                                   */
*a58d3d2aSXin Li     const opus_int             L                   /* I     Vector length                                              */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* NLSF stabilizer, for a single input data vector */
*a58d3d2aSXin Livoid silk_NLSF_stabilize(
*a58d3d2aSXin Li          opus_int16            *NLSF_Q15,          /* I/O   Unstable/stabilized normalized LSF vector in Q15 [L]       */
*a58d3d2aSXin Li    const opus_int16            *NDeltaMin_Q15,     /* I     Min distance vector, NDeltaMin_Q15[L] must be >= 1 [L+1]   */
*a58d3d2aSXin Li    const opus_int              L                   /* I     Number of NLSF parameters in the input vector              */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Laroia low complexity NLSF weights */
*a58d3d2aSXin Livoid silk_NLSF_VQ_weights_laroia(
*a58d3d2aSXin Li    opus_int16                  *pNLSFW_Q_OUT,      /* O     Pointer to input vector weights [D]                        */
*a58d3d2aSXin Li    const opus_int16            *pNLSF_Q15,         /* I     Pointer to input vector         [D]                        */
*a58d3d2aSXin Li    const opus_int              D                   /* I     Input vector dimension (even)                              */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Compute reflection coefficients from input signal */
*a58d3d2aSXin Livoid silk_burg_modified_c(
*a58d3d2aSXin Li    opus_int32                  *res_nrg,           /* O    Residual energy                                             */
*a58d3d2aSXin Li    opus_int                    *res_nrg_Q,         /* O    Residual energy Q value                                     */
*a58d3d2aSXin Li    opus_int32                  A_Q16[],            /* O    Prediction coefficients (length order)                      */
*a58d3d2aSXin Li    const opus_int16            x[],                /* I    Input signal, length: nb_subfr * ( D + subfr_length )       */
*a58d3d2aSXin Li    const opus_int32            minInvGain_Q30,     /* I    Inverse of max prediction gain                              */
*a58d3d2aSXin Li    const opus_int              subfr_length,       /* I    Input signal subframe length (incl. D preceding samples)    */
*a58d3d2aSXin Li    const opus_int              nb_subfr,           /* I    Number of subframes stacked in x                            */
*a58d3d2aSXin Li    const opus_int              D,                  /* I    Order                                                       */
*a58d3d2aSXin Li    int                         arch                /* I    Run-time architecture                                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Copy and multiply a vector by a constant */
*a58d3d2aSXin Livoid silk_scale_copy_vector16(
*a58d3d2aSXin Li    opus_int16                  *data_out,
*a58d3d2aSXin Li    const opus_int16            *data_in,
*a58d3d2aSXin Li    opus_int32                  gain_Q16,           /* I    Gain in Q16                                                 */
*a58d3d2aSXin Li    const opus_int              dataSize            /* I    Length                                                      */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Some for the LTP related function requires Q26 to work.*/
*a58d3d2aSXin Livoid silk_scale_vector32_Q26_lshift_18(
*a58d3d2aSXin Li    opus_int32                  *data1,             /* I/O  Q0/Q18                                                      */
*a58d3d2aSXin Li    opus_int32                  gain_Q26,           /* I    Q26                                                         */
*a58d3d2aSXin Li    opus_int                    dataSize            /* I    length                                                      */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/********************************************************************/
*a58d3d2aSXin Li/*                        INLINE ARM MATH                           */
*a58d3d2aSXin Li/********************************************************************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*    return sum( inVec1[i] * inVec2[i] ) */
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_int32 silk_inner_prod_aligned(
*a58d3d2aSXin Li    const opus_int16 *const     inVec1,             /*    I input vector 1                                              */
*a58d3d2aSXin Li    const opus_int16 *const     inVec2,             /*    I input vector 2                                              */
*a58d3d2aSXin Li    const opus_int              len,                /*    I vector lengths                                              */
*a58d3d2aSXin Li    int                         arch                /*    I Run-time architecture                                       */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_int32 silk_inner_prod_aligned_scale(
*a58d3d2aSXin Li    const opus_int16 *const     inVec1,             /*    I input vector 1                                              */
*a58d3d2aSXin Li    const opus_int16 *const     inVec2,             /*    I input vector 2                                              */
*a58d3d2aSXin Li    const opus_int              scale,              /*    I number of bits to shift                                     */
*a58d3d2aSXin Li    const opus_int              len                 /*    I vector lengths                                              */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_int64 silk_inner_prod16_c(
*a58d3d2aSXin Li    const opus_int16            *inVec1,            /*    I input vector 1                                              */
*a58d3d2aSXin Li    const opus_int16            *inVec2,            /*    I input vector 2                                              */
*a58d3d2aSXin Li    const opus_int              len                 /*    I vector lengths                                              */
*a58d3d2aSXin Li);
*a58d3d2aSXin Li
*a58d3d2aSXin Li/********************************************************************/
*a58d3d2aSXin Li/*                                MACROS                            */
*a58d3d2aSXin Li/********************************************************************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Rotate a32 right by 'rot' bits. Negative rot values result in rotating
*a58d3d2aSXin Li   left. Output is 32bit int.
*a58d3d2aSXin Li   Note: contemporary compilers recognize the C expression below and
*a58d3d2aSXin Li   compile it into a 'ror' instruction if available. No need for OPUS_INLINE ASM! */
*a58d3d2aSXin Listatic OPUS_INLINE opus_int32 silk_ROR32( opus_int32 a32, opus_int rot )
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    opus_uint32 x = (opus_uint32) a32;
*a58d3d2aSXin Li    opus_uint32 r = (opus_uint32) rot;
*a58d3d2aSXin Li    opus_uint32 m = (opus_uint32) -rot;
*a58d3d2aSXin Li    if( rot == 0 ) {
*a58d3d2aSXin Li        return a32;
*a58d3d2aSXin Li    } else if( rot < 0 ) {
*a58d3d2aSXin Li        return (opus_int32) ((x << m) | (x >> (32 - m)));
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li        return (opus_int32) ((x << (32 - r)) | (x >> r));
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Allocate opus_int16 aligned to 4-byte memory address */
*a58d3d2aSXin Li#if EMBEDDED_ARM
*a58d3d2aSXin Li#define silk_DWORD_ALIGN __attribute__((aligned(4)))
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#define silk_DWORD_ALIGN
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Useful Macros that can be adjusted to other platforms */
*a58d3d2aSXin Li#define silk_memcpy(dest, src, size)        memcpy((dest), (src), (size))
*a58d3d2aSXin Li#define silk_memset(dest, src, size)        memset((dest), (src), (size))
*a58d3d2aSXin Li#define silk_memmove(dest, src, size)       memmove((dest), (src), (size))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Fixed point macros */
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* (a32 * b32) output have to be 32bit int */
*a58d3d2aSXin Li#define silk_MUL(a32, b32)                  ((a32) * (b32))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* (a32 * b32) output have to be 32bit uint */
*a58d3d2aSXin Li#define silk_MUL_uint(a32, b32)             silk_MUL(a32, b32)
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* a32 + (b32 * c32) output have to be 32bit int */
*a58d3d2aSXin Li#define silk_MLA(a32, b32, c32)             silk_ADD32((a32),((b32) * (c32)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* a32 + (b32 * c32) output have to be 32bit uint */
*a58d3d2aSXin Li#define silk_MLA_uint(a32, b32, c32)        silk_MLA(a32, b32, c32)
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* ((a32 >> 16)  * (b32 >> 16)) output have to be 32bit int */
*a58d3d2aSXin Li#define silk_SMULTT(a32, b32)               (((a32) >> 16) * ((b32) >> 16))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* a32 + ((a32 >> 16)  * (b32 >> 16)) output have to be 32bit int */
*a58d3d2aSXin Li#define silk_SMLATT(a32, b32, c32)          silk_ADD32((a32),((b32) >> 16) * ((c32) >> 16))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_SMLALBB(a64, b16, c16)         silk_ADD64((a64),(opus_int64)((opus_int32)(b16) * (opus_int32)(c16)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* (a32 * b32) */
*a58d3d2aSXin Li#define silk_SMULL(a32, b32)                ((opus_int64)(a32) * /*(opus_int64)*/(b32))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Adds two signed 32-bit values in a way that can overflow, while not relying on undefined behaviour
*a58d3d2aSXin Li   (just standard two's complement implementation-specific behaviour) */
*a58d3d2aSXin Listatic OPUS_INLINE opus_int32 silk_ADD32_ovflw(opus_int32 a, opus_int32 b) {
*a58d3d2aSXin Li    opus_int32  _c;
*a58d3d2aSXin Li    __builtin_add_overflow(a, b, &_c);
*a58d3d2aSXin Li    return _c;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Subtractss two signed 32-bit values in a way that can overflow, while not relying on undefined behaviour
*a58d3d2aSXin Li   (just standard two's complement implementation-specific behaviour) */
*a58d3d2aSXin Listatic OPUS_INLINE opus_int32 silk_SUB32_ovflw(opus_int32 a, opus_int32 b) {
*a58d3d2aSXin Li    opus_int32  _c;
*a58d3d2aSXin Li    __builtin_sub_overflow(a, b, &_c);
*a58d3d2aSXin Li    return _c;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Multiply-accumulate macros that allow overflow in the addition (ie, no asserts in debug mode) */
*a58d3d2aSXin Li/* .. also ignoring multiply overflows; caller has comment about this happening occasionally */
*a58d3d2aSXin Listatic OPUS_INLINE opus_int32 silk_MLA_ovflw(opus_int32 a, opus_int32 b, opus_int32 c) {
*a58d3d2aSXin Li    opus_int32 _d, _e;
*a58d3d2aSXin Li    __builtin_mul_overflow(b, c, &_d);
*a58d3d2aSXin Li    __builtin_add_overflow(a, _d, &_e);
*a58d3d2aSXin Li    return _e;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_SMLABB_ovflw(a32, b32, c32)    (silk_ADD32_ovflw((a32) , ((opus_int32)((opus_int16)(b32))) * (opus_int32)((opus_int16)(c32))))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_DIV32_16(a32, b16)             ((opus_int32)((a32) / (b16)))
*a58d3d2aSXin Li#define silk_DIV32(a32, b32)                ((opus_int32)((a32) / (b32)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* These macros enables checking for overflow in silk_API_Debug.h*/
*a58d3d2aSXin Li#define silk_ADD16(a, b)                    ((a) + (b))
*a58d3d2aSXin Li#define silk_ADD32(a, b)                    ((a) + (b))
*a58d3d2aSXin Li#define silk_ADD64(a, b)                    ((a) + (b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_SUB16(a, b)                    ((a) - (b))
*a58d3d2aSXin Li#define silk_SUB32(a, b)                    ((a) - (b))
*a58d3d2aSXin Li#define silk_SUB64(a, b)                    ((a) - (b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_SAT8(a)                        ((a) > silk_int8_MAX ? silk_int8_MAX  :       \
*a58d3d2aSXin Li                                            ((a) < silk_int8_MIN ? silk_int8_MIN  : (a)))
*a58d3d2aSXin Li#define silk_SAT16(a)                       ((a) > silk_int16_MAX ? silk_int16_MAX :      \
*a58d3d2aSXin Li                                            ((a) < silk_int16_MIN ? silk_int16_MIN : (a)))
*a58d3d2aSXin Li#define silk_SAT32(a)                       ((a) > silk_int32_MAX ? silk_int32_MAX :      \
*a58d3d2aSXin Li                                            ((a) < silk_int32_MIN ? silk_int32_MIN : (a)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_CHECK_FIT8(a)                  (a)
*a58d3d2aSXin Li#define silk_CHECK_FIT16(a)                 (a)
*a58d3d2aSXin Li#define silk_CHECK_FIT32(a)                 (a)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_ADD_SAT16(a, b)                (opus_int16)silk_SAT16( silk_ADD32( (opus_int32)(a), (b) ) )
*a58d3d2aSXin Li#define silk_ADD_SAT64(a, b)                ((((a) + (b)) & 0x8000000000000000LL) == 0 ?                            \
*a58d3d2aSXin Li                                            ((((a) & (b)) & 0x8000000000000000LL) != 0 ? silk_int64_MIN : (a)+(b)) : \
*a58d3d2aSXin Li                                            ((((a) | (b)) & 0x8000000000000000LL) == 0 ? silk_int64_MAX : (a)+(b)) )
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_SUB_SAT16(a, b)                (opus_int16)silk_SAT16( silk_SUB32( (opus_int32)(a), (b) ) )
*a58d3d2aSXin Li#define silk_SUB_SAT64(a, b)                ((((a)-(b)) & 0x8000000000000000LL) == 0 ?                                               \
*a58d3d2aSXin Li                                            (( (a) & ((b)^0x8000000000000000LL) & 0x8000000000000000LL) ? silk_int64_MIN : (a)-(b)) : \
*a58d3d2aSXin Li                                            ((((a)^0x8000000000000000LL) & (b)  & 0x8000000000000000LL) ? silk_int64_MAX : (a)-(b)) )
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Saturation for positive input values */
*a58d3d2aSXin Li#define silk_POS_SAT32(a)                   ((a) > silk_int32_MAX ? silk_int32_MAX : (a))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Add with saturation for positive input values */
*a58d3d2aSXin Li#define silk_ADD_POS_SAT8(a, b)             ((((a)+(b)) & 0x80)                 ? silk_int8_MAX  : ((a)+(b)))
*a58d3d2aSXin Li#define silk_ADD_POS_SAT16(a, b)            ((((a)+(b)) & 0x8000)               ? silk_int16_MAX : ((a)+(b)))
*a58d3d2aSXin Listatic OPUS_INLINE opus_int32 silk_ADD_POS_SAT32(opus_int32 a, opus_int32 b) {
*a58d3d2aSXin Li    opus_int32  _c;
*a58d3d2aSXin Li    if (__builtin_add_overflow(a, b, &_c))
*a58d3d2aSXin Li        return silk_int32_MAX;
*a58d3d2aSXin Li    return _c;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_LSHIFT8(a, shift)              ((opus_int8)((opus_uint8)(a)<<(shift)))         /* shift >= 0, shift < 8  */
*a58d3d2aSXin Li#define silk_LSHIFT16(a, shift)             ((opus_int16)((opus_uint16)(a)<<(shift)))       /* shift >= 0, shift < 16 */
*a58d3d2aSXin Li#define silk_LSHIFT32(a, shift)             ((opus_int32)((opus_uint32)(a)<<(shift)))       /* shift >= 0, shift < 32 */
*a58d3d2aSXin Li#define silk_LSHIFT64(a, shift)             ((opus_int64)((opus_uint64)(a)<<(shift)))       /* shift >= 0, shift < 64 */
*a58d3d2aSXin Li#define silk_LSHIFT(a, shift)               silk_LSHIFT32(a, shift)                         /* shift >= 0, shift < 32 */
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_RSHIFT8(a, shift)              ((a)>>(shift))                                  /* shift >= 0, shift < 8  */
*a58d3d2aSXin Li#define silk_RSHIFT16(a, shift)             ((a)>>(shift))                                  /* shift >= 0, shift < 16 */
*a58d3d2aSXin Li#define silk_RSHIFT32(a, shift)             ((a)>>(shift))                                  /* shift >= 0, shift < 32 */
*a58d3d2aSXin Li#define silk_RSHIFT64(a, shift)             ((a)>>(shift))                                  /* shift >= 0, shift < 64 */
*a58d3d2aSXin Li#define silk_RSHIFT(a, shift)               silk_RSHIFT32(a, shift)                         /* shift >= 0, shift < 32 */
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* saturates before shifting */
*a58d3d2aSXin Li#define silk_LSHIFT_SAT32(a, shift)         (silk_LSHIFT32( silk_LIMIT( (a), silk_RSHIFT32( silk_int32_MIN, (shift) ), \
*a58d3d2aSXin Li                                                    silk_RSHIFT32( silk_int32_MAX, (shift) ) ), (shift) ))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_LSHIFT_ovflw(a, shift)         ((opus_int32)((opus_uint32)(a) << (shift)))     /* shift >= 0, allowed to overflow */
*a58d3d2aSXin Li#define silk_LSHIFT_uint(a, shift)          ((a) << (shift))                                /* shift >= 0 */
*a58d3d2aSXin Li#define silk_RSHIFT_uint(a, shift)          ((a) >> (shift))                                /* shift >= 0 */
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_ADD_LSHIFT(a, b, shift)        ((a) + silk_LSHIFT((b), (shift)))               /* shift >= 0 */
*a58d3d2aSXin Li#define silk_ADD_LSHIFT32(a, b, shift)      silk_ADD32((a), silk_LSHIFT32((b), (shift)))    /* shift >= 0 */
*a58d3d2aSXin Li#define silk_ADD_LSHIFT_uint(a, b, shift)   ((a) + silk_LSHIFT_uint((b), (shift)))          /* shift >= 0 */
*a58d3d2aSXin Li#define silk_ADD_RSHIFT(a, b, shift)        ((a) + silk_RSHIFT((b), (shift)))               /* shift >= 0 */
*a58d3d2aSXin Li#define silk_ADD_RSHIFT32(a, b, shift)      silk_ADD32((a), silk_RSHIFT32((b), (shift)))    /* shift >= 0 */
*a58d3d2aSXin Li#define silk_ADD_RSHIFT_uint(a, b, shift)   ((a) + silk_RSHIFT_uint((b), (shift)))          /* shift >= 0 */
*a58d3d2aSXin Li#define silk_SUB_LSHIFT32(a, b, shift)      silk_SUB32((a), silk_LSHIFT32((b), (shift)))    /* shift >= 0 */
*a58d3d2aSXin Li#define silk_SUB_RSHIFT32(a, b, shift)      silk_SUB32((a), silk_RSHIFT32((b), (shift)))    /* shift >= 0 */
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Requires that shift > 0 */
*a58d3d2aSXin Li#define silk_RSHIFT_ROUND(a, shift)         ((shift) == 1 ? ((a) >> 1) + ((a) & 1) : (((a) >> ((shift) - 1)) + 1) >> 1)
*a58d3d2aSXin Li#define silk_RSHIFT_ROUND64(a, shift)       ((shift) == 1 ? ((a) >> 1) + ((a) & 1) : (((a) >> ((shift) - 1)) + 1) >> 1)
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Number of rightshift required to fit the multiplication */
*a58d3d2aSXin Li#define silk_NSHIFT_MUL_32_32(a, b)         ( -(31- (32-silk_CLZ32(silk_abs(a)) + (32-silk_CLZ32(silk_abs(b))))) )
*a58d3d2aSXin Li#define silk_NSHIFT_MUL_16_16(a, b)         ( -(15- (16-silk_CLZ16(silk_abs(a)) + (16-silk_CLZ16(silk_abs(b))))) )
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_min(a, b)                      (((a) < (b)) ? (a) : (b))
*a58d3d2aSXin Li#define silk_max(a, b)                      (((a) > (b)) ? (a) : (b))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Macro to convert floating-point constants to fixed-point */
*a58d3d2aSXin Li#define SILK_FIX_CONST( C, Q )              ((opus_int32)((C) * ((opus_int64)1 << (Q)) + 0.5))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* silk_min() versions with typecast in the function call */
*a58d3d2aSXin Listatic OPUS_INLINE opus_int silk_min_int(opus_int a, opus_int b)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return (((a) < (b)) ? (a) : (b));
*a58d3d2aSXin Li}
*a58d3d2aSXin Listatic OPUS_INLINE opus_int16 silk_min_16(opus_int16 a, opus_int16 b)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return (((a) < (b)) ? (a) : (b));
*a58d3d2aSXin Li}
*a58d3d2aSXin Listatic OPUS_INLINE opus_int32 silk_min_32(opus_int32 a, opus_int32 b)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return (((a) < (b)) ? (a) : (b));
*a58d3d2aSXin Li}
*a58d3d2aSXin Listatic OPUS_INLINE opus_int64 silk_min_64(opus_int64 a, opus_int64 b)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return (((a) < (b)) ? (a) : (b));
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* silk_min() versions with typecast in the function call */
*a58d3d2aSXin Listatic OPUS_INLINE opus_int silk_max_int(opus_int a, opus_int b)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return (((a) > (b)) ? (a) : (b));
*a58d3d2aSXin Li}
*a58d3d2aSXin Listatic OPUS_INLINE opus_int16 silk_max_16(opus_int16 a, opus_int16 b)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return (((a) > (b)) ? (a) : (b));
*a58d3d2aSXin Li}
*a58d3d2aSXin Listatic OPUS_INLINE opus_int32 silk_max_32(opus_int32 a, opus_int32 b)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return (((a) > (b)) ? (a) : (b));
*a58d3d2aSXin Li}
*a58d3d2aSXin Listatic OPUS_INLINE opus_int64 silk_max_64(opus_int64 a, opus_int64 b)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return (((a) > (b)) ? (a) : (b));
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_LIMIT( a, limit1, limit2)      ((limit1) > (limit2) ? ((a) > (limit1) ? (limit1) : ((a) < (limit2) ? (limit2) : (a))) \
*a58d3d2aSXin Li                                                                 : ((a) > (limit2) ? (limit2) : ((a) < (limit1) ? (limit1) : (a))))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_LIMIT_int                      silk_LIMIT
*a58d3d2aSXin Li#define silk_LIMIT_16                       silk_LIMIT
*a58d3d2aSXin Li#define silk_LIMIT_32                       silk_LIMIT
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_abs(a)                         (((a) >  0)  ? (a) : -(a))            /* Be careful, silk_abs returns wrong when input equals to silk_intXX_MIN */
*a58d3d2aSXin Li#define silk_abs_int(a)                     (((a) ^ ((a) >> (8 * sizeof(a) - 1))) - ((a) >> (8 * sizeof(a) - 1)))
*a58d3d2aSXin Li#define silk_abs_int32(a)                   (((a) ^ ((a) >> 31)) - ((a) >> 31))
*a58d3d2aSXin Li#define silk_abs_int64(a)                   (((a) >  0)  ? (a) : -(a))
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define silk_sign(a)                        ((a) > 0 ? 1 : ( (a) < 0 ? -1 : 0 ))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* PSEUDO-RANDOM GENERATOR                                                          */
*a58d3d2aSXin Li/* Make sure to store the result as the seed for the next call (also in between     */
*a58d3d2aSXin Li/* frames), otherwise result won't be random at all. When only using some of the    */
*a58d3d2aSXin Li/* bits, take the most significant bits by right-shifting.                          */
*a58d3d2aSXin Li#define RAND_MULTIPLIER                     196314165
*a58d3d2aSXin Li#define RAND_INCREMENT                      907633515
*a58d3d2aSXin Li#define silk_RAND(seed)                     (silk_MLA_ovflw((RAND_INCREMENT), (seed), (RAND_MULTIPLIER)))
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*  Add some multiplication functions that can be easily mapped to ARM. */
*a58d3d2aSXin Li
*a58d3d2aSXin Li/*    silk_SMMUL: Signed top word multiply.
*a58d3d2aSXin Li          ARMv6        2 instruction cycles.
*a58d3d2aSXin Li          ARMv3M+      3 instruction cycles. use SMULL and ignore LSB registers.(except xM)*/
*a58d3d2aSXin Li/*#define silk_SMMUL(a32, b32)                (opus_int32)silk_RSHIFT(silk_SMLAL(silk_SMULWB((a32), (b32)), (a32), silk_RSHIFT_ROUND((b32), 16)), 16)*/
*a58d3d2aSXin Li/* the following seems faster on x86 */
*a58d3d2aSXin Li#define silk_SMMUL(a32, b32)                (opus_int32)silk_RSHIFT64(silk_SMULL((a32), (b32)), 32)
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if !defined(OVERRIDE_silk_burg_modified)
*a58d3d2aSXin Li#define silk_burg_modified(res_nrg, res_nrg_Q, A_Q16, x, minInvGain_Q30, subfr_length, nb_subfr, D, arch) \
*a58d3d2aSXin Li    ((void)(arch), silk_burg_modified_c(res_nrg, res_nrg_Q, A_Q16, x, minInvGain_Q30, subfr_length, nb_subfr, D, arch))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if !defined(OVERRIDE_silk_inner_prod16)
*a58d3d2aSXin Li#define silk_inner_prod16(inVec1, inVec2, len, arch) \
*a58d3d2aSXin Li    ((void)(arch),silk_inner_prod16_c(inVec1, inVec2, len))
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "Inlines.h"
*a58d3d2aSXin Li#include "MacroCount.h"
*a58d3d2aSXin Li#include "MacroDebug.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef OPUS_ARM_INLINE_ASM
*a58d3d2aSXin Li#include "arm/SigProc_FIX_armv4.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef OPUS_ARM_INLINE_EDSP
*a58d3d2aSXin Li#include "arm/SigProc_FIX_armv5e.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if defined(MIPSr1_ASM)
*a58d3d2aSXin Li#include "mips/sigproc_fix_mipsr1.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef  __cplusplus
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#endif /* SILK_SIGPROC_FIX_H */