libopus/celt/celt.c

*a58d3d2aSXin Li/* Copyright (c) 2007-2008 CSIRO
*a58d3d2aSXin Li   Copyright (c) 2007-2010 Xiph.Org Foundation
*a58d3d2aSXin Li   Copyright (c) 2008 Gregory Maxwell
*a58d3d2aSXin Li   Written by Jean-Marc Valin and Gregory Maxwell */
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
*a58d3d2aSXin Li   OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define CELT_C
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li#include "mdct.h"
*a58d3d2aSXin Li#include <math.h>
*a58d3d2aSXin Li#include "celt.h"
*a58d3d2aSXin Li#include "pitch.h"
*a58d3d2aSXin Li#include "bands.h"
*a58d3d2aSXin Li#include "modes.h"
*a58d3d2aSXin Li#include "entcode.h"
*a58d3d2aSXin Li#include "quant_bands.h"
*a58d3d2aSXin Li#include "rate.h"
*a58d3d2aSXin Li#include "stack_alloc.h"
*a58d3d2aSXin Li#include "mathops.h"
*a58d3d2aSXin Li#include "float_cast.h"
*a58d3d2aSXin Li#include <stdarg.h>
*a58d3d2aSXin Li#include "celt_lpc.h"
*a58d3d2aSXin Li#include "vq.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef PACKAGE_VERSION
*a58d3d2aSXin Li#define PACKAGE_VERSION "unknown"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if defined(MIPSr1_ASM)
*a58d3d2aSXin Li#include "mips/celt_mipsr1.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Liint resampling_factor(opus_int32 rate)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int ret;
*a58d3d2aSXin Li   switch (rate)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li   case 48000:
*a58d3d2aSXin Li      ret = 1;
*a58d3d2aSXin Li      break;
*a58d3d2aSXin Li   case 24000:
*a58d3d2aSXin Li      ret = 2;
*a58d3d2aSXin Li      break;
*a58d3d2aSXin Li   case 16000:
*a58d3d2aSXin Li      ret = 3;
*a58d3d2aSXin Li      break;
*a58d3d2aSXin Li   case 12000:
*a58d3d2aSXin Li      ret = 4;
*a58d3d2aSXin Li      break;
*a58d3d2aSXin Li   case 8000:
*a58d3d2aSXin Li      ret = 6;
*a58d3d2aSXin Li      break;
*a58d3d2aSXin Li   default:
*a58d3d2aSXin Li#ifndef CUSTOM_MODES
*a58d3d2aSXin Li      celt_assert(0);
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li      ret = 0;
*a58d3d2aSXin Li      break;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   return ret;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if !defined(OVERRIDE_COMB_FILTER_CONST) || defined(NON_STATIC_COMB_FILTER_CONST_C)
*a58d3d2aSXin Li/* This version should be faster on ARM */
*a58d3d2aSXin Li#ifdef OPUS_ARM_ASM
*a58d3d2aSXin Li#ifndef NON_STATIC_COMB_FILTER_CONST_C
*a58d3d2aSXin Listatic
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Livoid comb_filter_const_c(opus_val32 *y, opus_val32 *x, int T, int N,
*a58d3d2aSXin Li      opus_val16 g10, opus_val16 g11, opus_val16 g12)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   opus_val32 x0, x1, x2, x3, x4;
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   x4 = SHL32(x[-T-2], 1);
*a58d3d2aSXin Li   x3 = SHL32(x[-T-1], 1);
*a58d3d2aSXin Li   x2 = SHL32(x[-T], 1);
*a58d3d2aSXin Li   x1 = SHL32(x[-T+1], 1);
*a58d3d2aSXin Li   for (i=0;i<N-4;i+=5)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      opus_val32 t;
*a58d3d2aSXin Li      x0=SHL32(x[i-T+2],1);
*a58d3d2aSXin Li      t = MAC16_32_Q16(x[i], g10, x2);
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g11, ADD32(x1,x3));
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g12, ADD32(x0,x4));
*a58d3d2aSXin Li      t = SATURATE(t, SIG_SAT);
*a58d3d2aSXin Li      y[i] = t;
*a58d3d2aSXin Li      x4=SHL32(x[i-T+3],1);
*a58d3d2aSXin Li      t = MAC16_32_Q16(x[i+1], g10, x1);
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g11, ADD32(x0,x2));
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g12, ADD32(x4,x3));
*a58d3d2aSXin Li      t = SATURATE(t, SIG_SAT);
*a58d3d2aSXin Li      y[i+1] = t;
*a58d3d2aSXin Li      x3=SHL32(x[i-T+4],1);
*a58d3d2aSXin Li      t = MAC16_32_Q16(x[i+2], g10, x0);
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g11, ADD32(x4,x1));
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g12, ADD32(x3,x2));
*a58d3d2aSXin Li      t = SATURATE(t, SIG_SAT);
*a58d3d2aSXin Li      y[i+2] = t;
*a58d3d2aSXin Li      x2=SHL32(x[i-T+5],1);
*a58d3d2aSXin Li      t = MAC16_32_Q16(x[i+3], g10, x4);
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g11, ADD32(x3,x0));
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g12, ADD32(x2,x1));
*a58d3d2aSXin Li      t = SATURATE(t, SIG_SAT);
*a58d3d2aSXin Li      y[i+3] = t;
*a58d3d2aSXin Li      x1=SHL32(x[i-T+6],1);
*a58d3d2aSXin Li      t = MAC16_32_Q16(x[i+4], g10, x3);
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g11, ADD32(x2,x4));
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g12, ADD32(x1,x0));
*a58d3d2aSXin Li      t = SATURATE(t, SIG_SAT);
*a58d3d2aSXin Li      y[i+4] = t;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li#ifdef CUSTOM_MODES
*a58d3d2aSXin Li   for (;i<N;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      opus_val32 t;
*a58d3d2aSXin Li      x0=SHL32(x[i-T+2],1);
*a58d3d2aSXin Li      t = MAC16_32_Q16(x[i], g10, x2);
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g11, ADD32(x1,x3));
*a58d3d2aSXin Li      t = MAC16_32_Q16(t, g12, ADD32(x0,x4));
*a58d3d2aSXin Li      t = SATURATE(t, SIG_SAT);
*a58d3d2aSXin Li      y[i] = t;
*a58d3d2aSXin Li      x4=x3;
*a58d3d2aSXin Li      x3=x2;
*a58d3d2aSXin Li      x2=x1;
*a58d3d2aSXin Li      x1=x0;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li#ifndef NON_STATIC_COMB_FILTER_CONST_C
*a58d3d2aSXin Listatic
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Livoid comb_filter_const_c(opus_val32 *y, opus_val32 *x, int T, int N,
*a58d3d2aSXin Li      opus_val16 g10, opus_val16 g11, opus_val16 g12)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   opus_val32 x0, x1, x2, x3, x4;
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   x4 = x[-T-2];
*a58d3d2aSXin Li   x3 = x[-T-1];
*a58d3d2aSXin Li   x2 = x[-T];
*a58d3d2aSXin Li   x1 = x[-T+1];
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      x0=x[i-T+2];
*a58d3d2aSXin Li      y[i] = x[i]
*a58d3d2aSXin Li               + MULT16_32_Q15(g10,x2)
*a58d3d2aSXin Li               + MULT16_32_Q15(g11,ADD32(x1,x3))
*a58d3d2aSXin Li               + MULT16_32_Q15(g12,ADD32(x0,x4));
*a58d3d2aSXin Li      y[i] = SATURATE(y[i], SIG_SAT);
*a58d3d2aSXin Li      x4=x3;
*a58d3d2aSXin Li      x3=x2;
*a58d3d2aSXin Li      x2=x1;
*a58d3d2aSXin Li      x1=x0;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef OVERRIDE_comb_filter
*a58d3d2aSXin Livoid comb_filter(opus_val32 *y, opus_val32 *x, int T0, int T1, int N,
*a58d3d2aSXin Li      opus_val16 g0, opus_val16 g1, int tapset0, int tapset1,
*a58d3d2aSXin Li      const opus_val16 *window, int overlap, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   /* printf ("%d %d %f %f\n", T0, T1, g0, g1); */
*a58d3d2aSXin Li   opus_val16 g00, g01, g02, g10, g11, g12;
*a58d3d2aSXin Li   opus_val32 x0, x1, x2, x3, x4;
*a58d3d2aSXin Li   static const opus_val16 gains[3][3] = {
*a58d3d2aSXin Li         {QCONST16(0.3066406250f, 15), QCONST16(0.2170410156f, 15), QCONST16(0.1296386719f, 15)},
*a58d3d2aSXin Li         {QCONST16(0.4638671875f, 15), QCONST16(0.2680664062f, 15), QCONST16(0.f, 15)},
*a58d3d2aSXin Li         {QCONST16(0.7998046875f, 15), QCONST16(0.1000976562f, 15), QCONST16(0.f, 15)}};
*a58d3d2aSXin Li
*a58d3d2aSXin Li   if (g0==0 && g1==0)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      /* OPT: Happens to work without the OPUS_MOVE(), but only because the current encoder already copies x to y */
*a58d3d2aSXin Li      if (x!=y)
*a58d3d2aSXin Li         OPUS_MOVE(y, x, N);
*a58d3d2aSXin Li      return;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   /* When the gain is zero, T0 and/or T1 is set to zero. We need
*a58d3d2aSXin Li      to have then be at least 2 to avoid processing garbage data. */
*a58d3d2aSXin Li   T0 = IMAX(T0, COMBFILTER_MINPERIOD);
*a58d3d2aSXin Li   T1 = IMAX(T1, COMBFILTER_MINPERIOD);
*a58d3d2aSXin Li   g00 = MULT16_16_P15(g0, gains[tapset0][0]);
*a58d3d2aSXin Li   g01 = MULT16_16_P15(g0, gains[tapset0][1]);
*a58d3d2aSXin Li   g02 = MULT16_16_P15(g0, gains[tapset0][2]);
*a58d3d2aSXin Li   g10 = MULT16_16_P15(g1, gains[tapset1][0]);
*a58d3d2aSXin Li   g11 = MULT16_16_P15(g1, gains[tapset1][1]);
*a58d3d2aSXin Li   g12 = MULT16_16_P15(g1, gains[tapset1][2]);
*a58d3d2aSXin Li   x1 = x[-T1+1];
*a58d3d2aSXin Li   x2 = x[-T1  ];
*a58d3d2aSXin Li   x3 = x[-T1-1];
*a58d3d2aSXin Li   x4 = x[-T1-2];
*a58d3d2aSXin Li   /* If the filter didn't change, we don't need the overlap */
*a58d3d2aSXin Li   if (g0==g1 && T0==T1 && tapset0==tapset1)
*a58d3d2aSXin Li      overlap=0;
*a58d3d2aSXin Li   for (i=0;i<overlap;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      opus_val16 f;
*a58d3d2aSXin Li      x0=x[i-T1+2];
*a58d3d2aSXin Li      f = MULT16_16_Q15(window[i],window[i]);
*a58d3d2aSXin Li      y[i] = x[i]
*a58d3d2aSXin Li               + MULT16_32_Q15(MULT16_16_Q15((Q15ONE-f),g00),x[i-T0])
*a58d3d2aSXin Li               + MULT16_32_Q15(MULT16_16_Q15((Q15ONE-f),g01),ADD32(x[i-T0+1],x[i-T0-1]))
*a58d3d2aSXin Li               + MULT16_32_Q15(MULT16_16_Q15((Q15ONE-f),g02),ADD32(x[i-T0+2],x[i-T0-2]))
*a58d3d2aSXin Li               + MULT16_32_Q15(MULT16_16_Q15(f,g10),x2)
*a58d3d2aSXin Li               + MULT16_32_Q15(MULT16_16_Q15(f,g11),ADD32(x1,x3))
*a58d3d2aSXin Li               + MULT16_32_Q15(MULT16_16_Q15(f,g12),ADD32(x0,x4));
*a58d3d2aSXin Li      y[i] = SATURATE(y[i], SIG_SAT);
*a58d3d2aSXin Li      x4=x3;
*a58d3d2aSXin Li      x3=x2;
*a58d3d2aSXin Li      x2=x1;
*a58d3d2aSXin Li      x1=x0;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   if (g1==0)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      /* OPT: Happens to work without the OPUS_MOVE(), but only because the current encoder already copies x to y */
*a58d3d2aSXin Li      if (x!=y)
*a58d3d2aSXin Li         OPUS_MOVE(y+overlap, x+overlap, N-overlap);
*a58d3d2aSXin Li      return;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Compute the part with the constant filter. */
*a58d3d2aSXin Li   comb_filter_const(y+i, x+i, T1, N-i, g10, g11, g12, arch);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#endif /* OVERRIDE_comb_filter */
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* TF change table. Positive values mean better frequency resolution (longer
*a58d3d2aSXin Li   effective window), whereas negative values mean better time resolution
*a58d3d2aSXin Li   (shorter effective window). The second index is computed as:
*a58d3d2aSXin Li   4*isTransient + 2*tf_select + per_band_flag */
*a58d3d2aSXin Liconst signed char tf_select_table[4][8] = {
*a58d3d2aSXin Li    /*isTransient=0     isTransient=1 */
*a58d3d2aSXin Li      {0, -1, 0, -1,    0,-1, 0,-1}, /* 2.5 ms */
*a58d3d2aSXin Li      {0, -1, 0, -2,    1, 0, 1,-1}, /* 5 ms */
*a58d3d2aSXin Li      {0, -2, 0, -3,    2, 0, 1,-1}, /* 10 ms */
*a58d3d2aSXin Li      {0, -2, 0, -3,    3, 0, 1,-1}, /* 20 ms */
*a58d3d2aSXin Li};
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid init_caps(const CELTMode *m,int *cap,int LM,int C)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   for (i=0;i<m->nbEBands;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      int N;
*a58d3d2aSXin Li      N=(m->eBands[i+1]-m->eBands[i])<<LM;
*a58d3d2aSXin Li      cap[i] = (m->cache.caps[m->nbEBands*(2*LM+C-1)+i]+64)*C*N>>2;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Liconst char *opus_strerror(int error)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   static const char * const error_strings[8] = {
*a58d3d2aSXin Li      "success",
*a58d3d2aSXin Li      "invalid argument",
*a58d3d2aSXin Li      "buffer too small",
*a58d3d2aSXin Li      "internal error",
*a58d3d2aSXin Li      "corrupted stream",
*a58d3d2aSXin Li      "request not implemented",
*a58d3d2aSXin Li      "invalid state",
*a58d3d2aSXin Li      "memory allocation failed"
*a58d3d2aSXin Li   };
*a58d3d2aSXin Li   if (error > 0 || error < -7)
*a58d3d2aSXin Li      return "unknown error";
*a58d3d2aSXin Li   else
*a58d3d2aSXin Li      return error_strings[-error];
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liconst char *opus_get_version_string(void)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    return "libopus " PACKAGE_VERSION
*a58d3d2aSXin Li    /* Applications may rely on the presence of this substring in the version
*a58d3d2aSXin Li       string to determine if they have a fixed-point or floating-point build
*a58d3d2aSXin Li       at runtime. */
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li          "-fixed"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li#ifdef FUZZING
*a58d3d2aSXin Li          "-fuzzing"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li          ;
*a58d3d2aSXin Li}