libopus/celt/bands.c

*a58d3d2aSXin Li/* Copyright (c) 2007-2008 CSIRO
*a58d3d2aSXin Li   Copyright (c) 2007-2009 Xiph.Org Foundation
*a58d3d2aSXin Li   Copyright (c) 2008-2009 Gregory Maxwell
*a58d3d2aSXin Li   Written by Jean-Marc Valin and Gregory Maxwell */
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
*a58d3d2aSXin Li   OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include <math.h>
*a58d3d2aSXin Li#include "bands.h"
*a58d3d2aSXin Li#include "modes.h"
*a58d3d2aSXin Li#include "vq.h"
*a58d3d2aSXin Li#include "cwrs.h"
*a58d3d2aSXin Li#include "stack_alloc.h"
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li#include "mathops.h"
*a58d3d2aSXin Li#include "rate.h"
*a58d3d2aSXin Li#include "quant_bands.h"
*a58d3d2aSXin Li#include "pitch.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Liint hysteresis_decision(opus_val16 val, const opus_val16 *thresholds, const opus_val16 *hysteresis, int N, int prev)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   for (i=0;i<N;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      if (val < thresholds[i])
*a58d3d2aSXin Li         break;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   if (i>prev && val < thresholds[prev]+hysteresis[prev])
*a58d3d2aSXin Li      i=prev;
*a58d3d2aSXin Li   if (i<prev && val > thresholds[prev-1]-hysteresis[prev-1])
*a58d3d2aSXin Li      i=prev;
*a58d3d2aSXin Li   return i;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liopus_uint32 celt_lcg_rand(opus_uint32 seed)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   return 1664525 * seed + 1013904223;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* This is a cos() approximation designed to be bit-exact on any platform. Bit exactness
*a58d3d2aSXin Li   with this approximation is important because it has an impact on the bit allocation */
*a58d3d2aSXin Liopus_int16 bitexact_cos(opus_int16 x)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   opus_int32 tmp;
*a58d3d2aSXin Li   opus_int16 x2;
*a58d3d2aSXin Li   tmp = (4096+((opus_int32)(x)*(x)))>>13;
*a58d3d2aSXin Li   celt_sig_assert(tmp<=32767);
*a58d3d2aSXin Li   x2 = tmp;
*a58d3d2aSXin Li   x2 = (32767-x2) + FRAC_MUL16(x2, (-7651 + FRAC_MUL16(x2, (8277 + FRAC_MUL16(-626, x2)))));
*a58d3d2aSXin Li   celt_sig_assert(x2<=32766);
*a58d3d2aSXin Li   return 1+x2;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liint bitexact_log2tan(int isin,int icos)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int lc;
*a58d3d2aSXin Li   int ls;
*a58d3d2aSXin Li   lc=EC_ILOG(icos);
*a58d3d2aSXin Li   ls=EC_ILOG(isin);
*a58d3d2aSXin Li   icos<<=15-lc;
*a58d3d2aSXin Li   isin<<=15-ls;
*a58d3d2aSXin Li   return (ls-lc)*(1<<11)
*a58d3d2aSXin Li         +FRAC_MUL16(isin, FRAC_MUL16(isin, -2597) + 7932)
*a58d3d2aSXin Li         -FRAC_MUL16(icos, FRAC_MUL16(icos, -2597) + 7932);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li/* Compute the amplitude (sqrt energy) in each of the bands */
*a58d3d2aSXin Livoid compute_band_energies(const CELTMode *m, const celt_sig *X, celt_ener *bandE, int end, int C, int LM, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i, c, N;
*a58d3d2aSXin Li   const opus_int16 *eBands = m->eBands;
*a58d3d2aSXin Li   (void)arch;
*a58d3d2aSXin Li   N = m->shortMdctSize<<LM;
*a58d3d2aSXin Li   c=0; do {
*a58d3d2aSXin Li      for (i=0;i<end;i++)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int j;
*a58d3d2aSXin Li         opus_val32 maxval=0;
*a58d3d2aSXin Li         opus_val32 sum = 0;
*a58d3d2aSXin Li
*a58d3d2aSXin Li         maxval = celt_maxabs32(&X[c*N+(eBands[i]<<LM)], (eBands[i+1]-eBands[i])<<LM);
*a58d3d2aSXin Li         if (maxval > 0)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            int shift = celt_ilog2(maxval) - 14 + (((m->logN[i]>>BITRES)+LM+1)>>1);
*a58d3d2aSXin Li            j=eBands[i]<<LM;
*a58d3d2aSXin Li            if (shift>0)
*a58d3d2aSXin Li            {
*a58d3d2aSXin Li               do {
*a58d3d2aSXin Li                  sum = MAC16_16(sum, EXTRACT16(SHR32(X[j+c*N],shift)),
*a58d3d2aSXin Li                        EXTRACT16(SHR32(X[j+c*N],shift)));
*a58d3d2aSXin Li               } while (++j<eBands[i+1]<<LM);
*a58d3d2aSXin Li            } else {
*a58d3d2aSXin Li               do {
*a58d3d2aSXin Li                  sum = MAC16_16(sum, EXTRACT16(SHL32(X[j+c*N],-shift)),
*a58d3d2aSXin Li                        EXTRACT16(SHL32(X[j+c*N],-shift)));
*a58d3d2aSXin Li               } while (++j<eBands[i+1]<<LM);
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li            /* We're adding one here to ensure the normalized band isn't larger than unity norm */
*a58d3d2aSXin Li            bandE[i+c*m->nbEBands] = EPSILON+VSHR32(EXTEND32(celt_sqrt(sum)),-shift);
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            bandE[i+c*m->nbEBands] = EPSILON;
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li         /*printf ("%f ", bandE[i+c*m->nbEBands]);*/
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   } while (++c<C);
*a58d3d2aSXin Li   /*printf ("\n");*/
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Normalise each band such that the energy is one. */
*a58d3d2aSXin Livoid normalise_bands(const CELTMode *m, const celt_sig * OPUS_RESTRICT freq, celt_norm * OPUS_RESTRICT X, const celt_ener *bandE, int end, int C, int M)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i, c, N;
*a58d3d2aSXin Li   const opus_int16 *eBands = m->eBands;
*a58d3d2aSXin Li   N = M*m->shortMdctSize;
*a58d3d2aSXin Li   c=0; do {
*a58d3d2aSXin Li      i=0; do {
*a58d3d2aSXin Li         opus_val16 g;
*a58d3d2aSXin Li         int j,shift;
*a58d3d2aSXin Li         opus_val16 E;
*a58d3d2aSXin Li         shift = celt_zlog2(bandE[i+c*m->nbEBands])-13;
*a58d3d2aSXin Li         E = VSHR32(bandE[i+c*m->nbEBands], shift);
*a58d3d2aSXin Li         g = EXTRACT16(celt_rcp(SHL32(E,3)));
*a58d3d2aSXin Li         j=M*eBands[i]; do {
*a58d3d2aSXin Li            X[j+c*N] = MULT16_16_Q15(VSHR32(freq[j+c*N],shift-1),g);
*a58d3d2aSXin Li         } while (++j<M*eBands[i+1]);
*a58d3d2aSXin Li      } while (++i<end);
*a58d3d2aSXin Li   } while (++c<C);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#else /* FIXED_POINT */
*a58d3d2aSXin Li/* Compute the amplitude (sqrt energy) in each of the bands */
*a58d3d2aSXin Livoid compute_band_energies(const CELTMode *m, const celt_sig *X, celt_ener *bandE, int end, int C, int LM, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i, c, N;
*a58d3d2aSXin Li   const opus_int16 *eBands = m->eBands;
*a58d3d2aSXin Li   N = m->shortMdctSize<<LM;
*a58d3d2aSXin Li   c=0; do {
*a58d3d2aSXin Li      for (i=0;i<end;i++)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         opus_val32 sum;
*a58d3d2aSXin Li         sum = 1e-27f + celt_inner_prod(&X[c*N+(eBands[i]<<LM)], &X[c*N+(eBands[i]<<LM)], (eBands[i+1]-eBands[i])<<LM, arch);
*a58d3d2aSXin Li         bandE[i+c*m->nbEBands] = celt_sqrt(sum);
*a58d3d2aSXin Li         /*printf ("%f ", bandE[i+c*m->nbEBands]);*/
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   } while (++c<C);
*a58d3d2aSXin Li   /*printf ("\n");*/
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Normalise each band such that the energy is one. */
*a58d3d2aSXin Livoid normalise_bands(const CELTMode *m, const celt_sig * OPUS_RESTRICT freq, celt_norm * OPUS_RESTRICT X, const celt_ener *bandE, int end, int C, int M)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i, c, N;
*a58d3d2aSXin Li   const opus_int16 *eBands = m->eBands;
*a58d3d2aSXin Li   N = M*m->shortMdctSize;
*a58d3d2aSXin Li   c=0; do {
*a58d3d2aSXin Li      for (i=0;i<end;i++)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int j;
*a58d3d2aSXin Li         opus_val16 g = 1.f/(1e-27f+bandE[i+c*m->nbEBands]);
*a58d3d2aSXin Li         for (j=M*eBands[i];j<M*eBands[i+1];j++)
*a58d3d2aSXin Li            X[j+c*N] = freq[j+c*N]*g;
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   } while (++c<C);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#endif /* FIXED_POINT */
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* De-normalise the energy to produce the synthesis from the unit-energy bands */
*a58d3d2aSXin Livoid denormalise_bands(const CELTMode *m, const celt_norm * OPUS_RESTRICT X,
*a58d3d2aSXin Li      celt_sig * OPUS_RESTRICT freq, const opus_val16 *bandLogE, int start,
*a58d3d2aSXin Li      int end, int M, int downsample, int silence)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i, N;
*a58d3d2aSXin Li   int bound;
*a58d3d2aSXin Li   celt_sig * OPUS_RESTRICT f;
*a58d3d2aSXin Li   const celt_norm * OPUS_RESTRICT x;
*a58d3d2aSXin Li   const opus_int16 *eBands = m->eBands;
*a58d3d2aSXin Li   N = M*m->shortMdctSize;
*a58d3d2aSXin Li   bound = M*eBands[end];
*a58d3d2aSXin Li   if (downsample!=1)
*a58d3d2aSXin Li      bound = IMIN(bound, N/downsample);
*a58d3d2aSXin Li   if (silence)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      bound = 0;
*a58d3d2aSXin Li      start = end = 0;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   f = freq;
*a58d3d2aSXin Li   x = X+M*eBands[start];
*a58d3d2aSXin Li   for (i=0;i<M*eBands[start];i++)
*a58d3d2aSXin Li      *f++ = 0;
*a58d3d2aSXin Li   for (i=start;i<end;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      int j, band_end;
*a58d3d2aSXin Li      opus_val16 g;
*a58d3d2aSXin Li      opus_val16 lg;
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li      int shift;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li      j=M*eBands[i];
*a58d3d2aSXin Li      band_end = M*eBands[i+1];
*a58d3d2aSXin Li      lg = SATURATE16(ADD32(bandLogE[i], SHL32((opus_val32)eMeans[i],6)));
*a58d3d2aSXin Li#ifndef FIXED_POINT
*a58d3d2aSXin Li      g = celt_exp2(MIN32(32.f, lg));
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li      /* Handle the integer part of the log energy */
*a58d3d2aSXin Li      shift = 16-(lg>>DB_SHIFT);
*a58d3d2aSXin Li      if (shift>31)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         shift=0;
*a58d3d2aSXin Li         g=0;
*a58d3d2aSXin Li      } else {
*a58d3d2aSXin Li         /* Handle the fractional part. */
*a58d3d2aSXin Li         g = celt_exp2_frac(lg&((1<<DB_SHIFT)-1));
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      /* Handle extreme gains with negative shift. */
*a58d3d2aSXin Li      if (shift<0)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         /* For shift <= -2 and g > 16384 we'd be likely to overflow, so we're
*a58d3d2aSXin Li            capping the gain here, which is equivalent to a cap of 18 on lg.
*a58d3d2aSXin Li            This shouldn't trigger unless the bitstream is already corrupted. */
*a58d3d2aSXin Li         if (shift <= -2)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            g = 16384;
*a58d3d2aSXin Li            shift = -2;
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li         do {
*a58d3d2aSXin Li            *f++ = SHL32(MULT16_16(*x++, g), -shift);
*a58d3d2aSXin Li         } while (++j<band_end);
*a58d3d2aSXin Li      } else
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li         /* Be careful of the fixed-point "else" just above when changing this code */
*a58d3d2aSXin Li         do {
*a58d3d2aSXin Li            *f++ = SHR32(MULT16_16(*x++, g), shift);
*a58d3d2aSXin Li         } while (++j<band_end);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   celt_assert(start <= end);
*a58d3d2aSXin Li   OPUS_CLEAR(&freq[bound], N-bound);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* This prevents energy collapse for transients with multiple short MDCTs */
*a58d3d2aSXin Livoid anti_collapse(const CELTMode *m, celt_norm *X_, unsigned char *collapse_masks, int LM, int C, int size,
*a58d3d2aSXin Li      int start, int end, const opus_val16 *logE, const opus_val16 *prev1logE,
*a58d3d2aSXin Li      const opus_val16 *prev2logE, const int *pulses, opus_uint32 seed, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int c, i, j, k;
*a58d3d2aSXin Li   for (i=start;i<end;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      int N0;
*a58d3d2aSXin Li      opus_val16 thresh, sqrt_1;
*a58d3d2aSXin Li      int depth;
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li      int shift;
*a58d3d2aSXin Li      opus_val32 thresh32;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li      N0 = m->eBands[i+1]-m->eBands[i];
*a58d3d2aSXin Li      /* depth in 1/8 bits */
*a58d3d2aSXin Li      celt_sig_assert(pulses[i]>=0);
*a58d3d2aSXin Li      depth = celt_udiv(1+pulses[i], (m->eBands[i+1]-m->eBands[i]))>>LM;
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li      thresh32 = SHR32(celt_exp2(-SHL16(depth, 10-BITRES)),1);
*a58d3d2aSXin Li      thresh = MULT16_32_Q15(QCONST16(0.5f, 15), MIN32(32767,thresh32));
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         opus_val32 t;
*a58d3d2aSXin Li         t = N0<<LM;
*a58d3d2aSXin Li         shift = celt_ilog2(t)>>1;
*a58d3d2aSXin Li         t = SHL32(t, (7-shift)<<1);
*a58d3d2aSXin Li         sqrt_1 = celt_rsqrt_norm(t);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li      thresh = .5f*celt_exp2(-.125f*depth);
*a58d3d2aSXin Li      sqrt_1 = celt_rsqrt(N0<<LM);
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li      c=0; do
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         celt_norm *X;
*a58d3d2aSXin Li         opus_val16 prev1;
*a58d3d2aSXin Li         opus_val16 prev2;
*a58d3d2aSXin Li         opus_val32 Ediff;
*a58d3d2aSXin Li         opus_val16 r;
*a58d3d2aSXin Li         int renormalize=0;
*a58d3d2aSXin Li         prev1 = prev1logE[c*m->nbEBands+i];
*a58d3d2aSXin Li         prev2 = prev2logE[c*m->nbEBands+i];
*a58d3d2aSXin Li         if (C==1)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            prev1 = MAX16(prev1,prev1logE[m->nbEBands+i]);
*a58d3d2aSXin Li            prev2 = MAX16(prev2,prev2logE[m->nbEBands+i]);
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li         Ediff = EXTEND32(logE[c*m->nbEBands+i])-EXTEND32(MIN16(prev1,prev2));
*a58d3d2aSXin Li         Ediff = MAX32(0, Ediff);
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li         if (Ediff < 16384)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            opus_val32 r32 = SHR32(celt_exp2(-EXTRACT16(Ediff)),1);
*a58d3d2aSXin Li            r = 2*MIN16(16383,r32);
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            r = 0;
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li         if (LM==3)
*a58d3d2aSXin Li            r = MULT16_16_Q14(23170, MIN32(23169, r));
*a58d3d2aSXin Li         r = SHR16(MIN16(thresh, r),1);
*a58d3d2aSXin Li         r = SHR32(MULT16_16_Q15(sqrt_1, r),shift);
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li         /* r needs to be multiplied by 2 or 2*sqrt(2) depending on LM because
*a58d3d2aSXin Li            short blocks don't have the same energy as long */
*a58d3d2aSXin Li         r = 2.f*celt_exp2(-Ediff);
*a58d3d2aSXin Li         if (LM==3)
*a58d3d2aSXin Li            r *= 1.41421356f;
*a58d3d2aSXin Li         r = MIN16(thresh, r);
*a58d3d2aSXin Li         r = r*sqrt_1;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li         X = X_+c*size+(m->eBands[i]<<LM);
*a58d3d2aSXin Li         for (k=0;k<1<<LM;k++)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            /* Detect collapse */
*a58d3d2aSXin Li            if (!(collapse_masks[i*C+c]&1<<k))
*a58d3d2aSXin Li            {
*a58d3d2aSXin Li               /* Fill with noise */
*a58d3d2aSXin Li               for (j=0;j<N0;j++)
*a58d3d2aSXin Li               {
*a58d3d2aSXin Li                  seed = celt_lcg_rand(seed);
*a58d3d2aSXin Li                  X[(j<<LM)+k] = (seed&0x8000 ? r : -r);
*a58d3d2aSXin Li               }
*a58d3d2aSXin Li               renormalize = 1;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li         /* We just added some energy, so we need to renormalise */
*a58d3d2aSXin Li         if (renormalize)
*a58d3d2aSXin Li            renormalise_vector(X, N0<<LM, Q15ONE, arch);
*a58d3d2aSXin Li      } while (++c<C);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Compute the weights to use for optimizing normalized distortion across
*a58d3d2aSXin Li   channels. We use the amplitude to weight square distortion, which means
*a58d3d2aSXin Li   that we use the square root of the value we would have been using if we
*a58d3d2aSXin Li   wanted to minimize the MSE in the non-normalized domain. This roughly
*a58d3d2aSXin Li   corresponds to some quick-and-dirty perceptual experiments I ran to
*a58d3d2aSXin Li   measure inter-aural masking (there doesn't seem to be any published data
*a58d3d2aSXin Li   on the topic). */
*a58d3d2aSXin Listatic void compute_channel_weights(celt_ener Ex, celt_ener Ey, opus_val16 w[2])
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   celt_ener minE;
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li   int shift;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li   minE = MIN32(Ex, Ey);
*a58d3d2aSXin Li   /* Adjustment to make the weights a bit more conservative. */
*a58d3d2aSXin Li   Ex = ADD32(Ex, minE/3);
*a58d3d2aSXin Li   Ey = ADD32(Ey, minE/3);
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li   shift = celt_ilog2(EPSILON+MAX32(Ex, Ey))-14;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li   w[0] = VSHR32(Ex, shift);
*a58d3d2aSXin Li   w[1] = VSHR32(Ey, shift);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void intensity_stereo(const CELTMode *m, celt_norm * OPUS_RESTRICT X, const celt_norm * OPUS_RESTRICT Y, const celt_ener *bandE, int bandID, int N)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i = bandID;
*a58d3d2aSXin Li   int j;
*a58d3d2aSXin Li   opus_val16 a1, a2;
*a58d3d2aSXin Li   opus_val16 left, right;
*a58d3d2aSXin Li   opus_val16 norm;
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li   int shift = celt_zlog2(MAX32(bandE[i], bandE[i+m->nbEBands]))-13;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li   left = VSHR32(bandE[i],shift);
*a58d3d2aSXin Li   right = VSHR32(bandE[i+m->nbEBands],shift);
*a58d3d2aSXin Li   norm = EPSILON + celt_sqrt(EPSILON+MULT16_16(left,left)+MULT16_16(right,right));
*a58d3d2aSXin Li   a1 = DIV32_16(SHL32(EXTEND32(left),14),norm);
*a58d3d2aSXin Li   a2 = DIV32_16(SHL32(EXTEND32(right),14),norm);
*a58d3d2aSXin Li   for (j=0;j<N;j++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      celt_norm r, l;
*a58d3d2aSXin Li      l = X[j];
*a58d3d2aSXin Li      r = Y[j];
*a58d3d2aSXin Li      X[j] = EXTRACT16(SHR32(MAC16_16(MULT16_16(a1, l), a2, r), 14));
*a58d3d2aSXin Li      /* Side is not encoded, no need to calculate */
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void stereo_split(celt_norm * OPUS_RESTRICT X, celt_norm * OPUS_RESTRICT Y, int N)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int j;
*a58d3d2aSXin Li   for (j=0;j<N;j++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      opus_val32 r, l;
*a58d3d2aSXin Li      l = MULT16_16(QCONST16(.70710678f, 15), X[j]);
*a58d3d2aSXin Li      r = MULT16_16(QCONST16(.70710678f, 15), Y[j]);
*a58d3d2aSXin Li      X[j] = EXTRACT16(SHR32(ADD32(l, r), 15));
*a58d3d2aSXin Li      Y[j] = EXTRACT16(SHR32(SUB32(r, l), 15));
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void stereo_merge(celt_norm * OPUS_RESTRICT X, celt_norm * OPUS_RESTRICT Y, opus_val16 mid, int N, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int j;
*a58d3d2aSXin Li   opus_val32 xp=0, side=0;
*a58d3d2aSXin Li   opus_val32 El, Er;
*a58d3d2aSXin Li   opus_val16 mid2;
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li   int kl, kr;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li   opus_val32 t, lgain, rgain;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Compute the norm of X+Y and X-Y as |X|^2 + |Y|^2 +/- sum(xy) */
*a58d3d2aSXin Li   dual_inner_prod(Y, X, Y, N, &xp, &side, arch);
*a58d3d2aSXin Li   /* Compensating for the mid normalization */
*a58d3d2aSXin Li   xp = MULT16_32_Q15(mid, xp);
*a58d3d2aSXin Li   /* mid and side are in Q15, not Q14 like X and Y */
*a58d3d2aSXin Li   mid2 = SHR16(mid, 1);
*a58d3d2aSXin Li   El = MULT16_16(mid2, mid2) + side - 2*xp;
*a58d3d2aSXin Li   Er = MULT16_16(mid2, mid2) + side + 2*xp;
*a58d3d2aSXin Li   if (Er < QCONST32(6e-4f, 28) || El < QCONST32(6e-4f, 28))
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      OPUS_COPY(Y, X, N);
*a58d3d2aSXin Li      return;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li   kl = celt_ilog2(El)>>1;
*a58d3d2aSXin Li   kr = celt_ilog2(Er)>>1;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li   t = VSHR32(El, (kl-7)<<1);
*a58d3d2aSXin Li   lgain = celt_rsqrt_norm(t);
*a58d3d2aSXin Li   t = VSHR32(Er, (kr-7)<<1);
*a58d3d2aSXin Li   rgain = celt_rsqrt_norm(t);
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li   if (kl < 7)
*a58d3d2aSXin Li      kl = 7;
*a58d3d2aSXin Li   if (kr < 7)
*a58d3d2aSXin Li      kr = 7;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li   for (j=0;j<N;j++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      celt_norm r, l;
*a58d3d2aSXin Li      /* Apply mid scaling (side is already scaled) */
*a58d3d2aSXin Li      l = MULT16_16_P15(mid, X[j]);
*a58d3d2aSXin Li      r = Y[j];
*a58d3d2aSXin Li      X[j] = EXTRACT16(PSHR32(MULT16_16(lgain, SUB16(l,r)), kl+1));
*a58d3d2aSXin Li      Y[j] = EXTRACT16(PSHR32(MULT16_16(rgain, ADD16(l,r)), kr+1));
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Decide whether we should spread the pulses in the current frame */
*a58d3d2aSXin Liint spreading_decision(const CELTMode *m, const celt_norm *X, int *average,
*a58d3d2aSXin Li      int last_decision, int *hf_average, int *tapset_decision, int update_hf,
*a58d3d2aSXin Li      int end, int C, int M, const int *spread_weight)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i, c, N0;
*a58d3d2aSXin Li   int sum = 0, nbBands=0;
*a58d3d2aSXin Li   const opus_int16 * OPUS_RESTRICT eBands = m->eBands;
*a58d3d2aSXin Li   int decision;
*a58d3d2aSXin Li   int hf_sum=0;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   celt_assert(end>0);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   N0 = M*m->shortMdctSize;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   if (M*(eBands[end]-eBands[end-1]) <= 8)
*a58d3d2aSXin Li      return SPREAD_NONE;
*a58d3d2aSXin Li   c=0; do {
*a58d3d2aSXin Li      for (i=0;i<end;i++)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int j, N, tmp=0;
*a58d3d2aSXin Li         int tcount[3] = {0,0,0};
*a58d3d2aSXin Li         const celt_norm * OPUS_RESTRICT x = X+M*eBands[i]+c*N0;
*a58d3d2aSXin Li         N = M*(eBands[i+1]-eBands[i]);
*a58d3d2aSXin Li         if (N<=8)
*a58d3d2aSXin Li            continue;
*a58d3d2aSXin Li         /* Compute rough CDF of |x[j]| */
*a58d3d2aSXin Li         for (j=0;j<N;j++)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            opus_val32 x2N; /* Q13 */
*a58d3d2aSXin Li
*a58d3d2aSXin Li            x2N = MULT16_16(MULT16_16_Q15(x[j], x[j]), N);
*a58d3d2aSXin Li            if (x2N < QCONST16(0.25f,13))
*a58d3d2aSXin Li               tcount[0]++;
*a58d3d2aSXin Li            if (x2N < QCONST16(0.0625f,13))
*a58d3d2aSXin Li               tcount[1]++;
*a58d3d2aSXin Li            if (x2N < QCONST16(0.015625f,13))
*a58d3d2aSXin Li               tcount[2]++;
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li
*a58d3d2aSXin Li         /* Only include four last bands (8 kHz and up) */
*a58d3d2aSXin Li         if (i>m->nbEBands-4)
*a58d3d2aSXin Li            hf_sum += celt_udiv(32*(tcount[1]+tcount[0]), N);
*a58d3d2aSXin Li         tmp = (2*tcount[2] >= N) + (2*tcount[1] >= N) + (2*tcount[0] >= N);
*a58d3d2aSXin Li         sum += tmp*spread_weight[i];
*a58d3d2aSXin Li         nbBands+=spread_weight[i];
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   } while (++c<C);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   if (update_hf)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      if (hf_sum)
*a58d3d2aSXin Li         hf_sum = celt_udiv(hf_sum, C*(4-m->nbEBands+end));
*a58d3d2aSXin Li      *hf_average = (*hf_average+hf_sum)>>1;
*a58d3d2aSXin Li      hf_sum = *hf_average;
*a58d3d2aSXin Li      if (*tapset_decision==2)
*a58d3d2aSXin Li         hf_sum += 4;
*a58d3d2aSXin Li      else if (*tapset_decision==0)
*a58d3d2aSXin Li         hf_sum -= 4;
*a58d3d2aSXin Li      if (hf_sum > 22)
*a58d3d2aSXin Li         *tapset_decision=2;
*a58d3d2aSXin Li      else if (hf_sum > 18)
*a58d3d2aSXin Li         *tapset_decision=1;
*a58d3d2aSXin Li      else
*a58d3d2aSXin Li         *tapset_decision=0;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   /*printf("%d %d %d\n", hf_sum, *hf_average, *tapset_decision);*/
*a58d3d2aSXin Li   celt_assert(nbBands>0); /* end has to be non-zero */
*a58d3d2aSXin Li   celt_assert(sum>=0);
*a58d3d2aSXin Li   sum = celt_udiv((opus_int32)sum<<8, nbBands);
*a58d3d2aSXin Li   /* Recursive averaging */
*a58d3d2aSXin Li   sum = (sum+*average)>>1;
*a58d3d2aSXin Li   *average = sum;
*a58d3d2aSXin Li   /* Hysteresis */
*a58d3d2aSXin Li   sum = (3*sum + (((3-last_decision)<<7) + 64) + 2)>>2;
*a58d3d2aSXin Li   if (sum < 80)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      decision = SPREAD_AGGRESSIVE;
*a58d3d2aSXin Li   } else if (sum < 256)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      decision = SPREAD_NORMAL;
*a58d3d2aSXin Li   } else if (sum < 384)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      decision = SPREAD_LIGHT;
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      decision = SPREAD_NONE;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li#ifdef FUZZING
*a58d3d2aSXin Li   decision = rand()&0x3;
*a58d3d2aSXin Li   *tapset_decision=rand()%3;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li   return decision;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Indexing table for converting from natural Hadamard to ordery Hadamard
*a58d3d2aSXin Li   This is essentially a bit-reversed Gray, on top of which we've added
*a58d3d2aSXin Li   an inversion of the order because we want the DC at the end rather than
*a58d3d2aSXin Li   the beginning. The lines are for N=2, 4, 8, 16 */
*a58d3d2aSXin Listatic const int ordery_table[] = {
*a58d3d2aSXin Li       1,  0,
*a58d3d2aSXin Li       3,  0,  2,  1,
*a58d3d2aSXin Li       7,  0,  4,  3,  6,  1,  5,  2,
*a58d3d2aSXin Li      15,  0,  8,  7, 12,  3, 11,  4, 14,  1,  9,  6, 13,  2, 10,  5,
*a58d3d2aSXin Li};
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void deinterleave_hadamard(celt_norm *X, int N0, int stride, int hadamard)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i,j;
*a58d3d2aSXin Li   VARDECL(celt_norm, tmp);
*a58d3d2aSXin Li   int N;
*a58d3d2aSXin Li   SAVE_STACK;
*a58d3d2aSXin Li   N = N0*stride;
*a58d3d2aSXin Li   ALLOC(tmp, N, celt_norm);
*a58d3d2aSXin Li   celt_assert(stride>0);
*a58d3d2aSXin Li   if (hadamard)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      const int *ordery = ordery_table+stride-2;
*a58d3d2aSXin Li      for (i=0;i<stride;i++)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         for (j=0;j<N0;j++)
*a58d3d2aSXin Li            tmp[ordery[i]*N0+j] = X[j*stride+i];
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      for (i=0;i<stride;i++)
*a58d3d2aSXin Li         for (j=0;j<N0;j++)
*a58d3d2aSXin Li            tmp[i*N0+j] = X[j*stride+i];
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   OPUS_COPY(X, tmp, N);
*a58d3d2aSXin Li   RESTORE_STACK;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void interleave_hadamard(celt_norm *X, int N0, int stride, int hadamard)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i,j;
*a58d3d2aSXin Li   VARDECL(celt_norm, tmp);
*a58d3d2aSXin Li   int N;
*a58d3d2aSXin Li   SAVE_STACK;
*a58d3d2aSXin Li   N = N0*stride;
*a58d3d2aSXin Li   ALLOC(tmp, N, celt_norm);
*a58d3d2aSXin Li   if (hadamard)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      const int *ordery = ordery_table+stride-2;
*a58d3d2aSXin Li      for (i=0;i<stride;i++)
*a58d3d2aSXin Li         for (j=0;j<N0;j++)
*a58d3d2aSXin Li            tmp[j*stride+i] = X[ordery[i]*N0+j];
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      for (i=0;i<stride;i++)
*a58d3d2aSXin Li         for (j=0;j<N0;j++)
*a58d3d2aSXin Li            tmp[j*stride+i] = X[i*N0+j];
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   OPUS_COPY(X, tmp, N);
*a58d3d2aSXin Li   RESTORE_STACK;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid haar1(celt_norm *X, int N0, int stride)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i, j;
*a58d3d2aSXin Li   N0 >>= 1;
*a58d3d2aSXin Li   for (i=0;i<stride;i++)
*a58d3d2aSXin Li      for (j=0;j<N0;j++)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         opus_val32 tmp1, tmp2;
*a58d3d2aSXin Li         tmp1 = MULT16_16(QCONST16(.70710678f,15), X[stride*2*j+i]);
*a58d3d2aSXin Li         tmp2 = MULT16_16(QCONST16(.70710678f,15), X[stride*(2*j+1)+i]);
*a58d3d2aSXin Li         X[stride*2*j+i] = EXTRACT16(PSHR32(ADD32(tmp1, tmp2), 15));
*a58d3d2aSXin Li         X[stride*(2*j+1)+i] = EXTRACT16(PSHR32(SUB32(tmp1, tmp2), 15));
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic int compute_qn(int N, int b, int offset, int pulse_cap, int stereo)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   static const opus_int16 exp2_table8[8] =
*a58d3d2aSXin Li      {16384, 17866, 19483, 21247, 23170, 25267, 27554, 30048};
*a58d3d2aSXin Li   int qn, qb;
*a58d3d2aSXin Li   int N2 = 2*N-1;
*a58d3d2aSXin Li   if (stereo && N==2)
*a58d3d2aSXin Li      N2--;
*a58d3d2aSXin Li   /* The upper limit ensures that in a stereo split with itheta==16384, we'll
*a58d3d2aSXin Li       always have enough bits left over to code at least one pulse in the
*a58d3d2aSXin Li       side; otherwise it would collapse, since it doesn't get folded. */
*a58d3d2aSXin Li   qb = celt_sudiv(b+N2*offset, N2);
*a58d3d2aSXin Li   qb = IMIN(b-pulse_cap-(4<<BITRES), qb);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   qb = IMIN(8<<BITRES, qb);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   if (qb<(1<<BITRES>>1)) {
*a58d3d2aSXin Li      qn = 1;
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      qn = exp2_table8[qb&0x7]>>(14-(qb>>BITRES));
*a58d3d2aSXin Li      qn = (qn+1)>>1<<1;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   celt_assert(qn <= 256);
*a58d3d2aSXin Li   return qn;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listruct band_ctx {
*a58d3d2aSXin Li   int encode;
*a58d3d2aSXin Li   int resynth;
*a58d3d2aSXin Li   const CELTMode *m;
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   int intensity;
*a58d3d2aSXin Li   int spread;
*a58d3d2aSXin Li   int tf_change;
*a58d3d2aSXin Li   ec_ctx *ec;
*a58d3d2aSXin Li   opus_int32 remaining_bits;
*a58d3d2aSXin Li   const celt_ener *bandE;
*a58d3d2aSXin Li   opus_uint32 seed;
*a58d3d2aSXin Li   int arch;
*a58d3d2aSXin Li   int theta_round;
*a58d3d2aSXin Li   int disable_inv;
*a58d3d2aSXin Li   int avoid_split_noise;
*a58d3d2aSXin Li};
*a58d3d2aSXin Li
*a58d3d2aSXin Listruct split_ctx {
*a58d3d2aSXin Li   int inv;
*a58d3d2aSXin Li   int imid;
*a58d3d2aSXin Li   int iside;
*a58d3d2aSXin Li   int delta;
*a58d3d2aSXin Li   int itheta;
*a58d3d2aSXin Li   int qalloc;
*a58d3d2aSXin Li};
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void compute_theta(struct band_ctx *ctx, struct split_ctx *sctx,
*a58d3d2aSXin Li      celt_norm *X, celt_norm *Y, int N, int *b, int B, int B0,
*a58d3d2aSXin Li      int LM,
*a58d3d2aSXin Li      int stereo, int *fill)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int qn;
*a58d3d2aSXin Li   int itheta=0;
*a58d3d2aSXin Li   int delta;
*a58d3d2aSXin Li   int imid, iside;
*a58d3d2aSXin Li   int qalloc;
*a58d3d2aSXin Li   int pulse_cap;
*a58d3d2aSXin Li   int offset;
*a58d3d2aSXin Li   opus_int32 tell;
*a58d3d2aSXin Li   int inv=0;
*a58d3d2aSXin Li   int encode;
*a58d3d2aSXin Li   const CELTMode *m;
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   int intensity;
*a58d3d2aSXin Li   ec_ctx *ec;
*a58d3d2aSXin Li   const celt_ener *bandE;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   encode = ctx->encode;
*a58d3d2aSXin Li   m = ctx->m;
*a58d3d2aSXin Li   i = ctx->i;
*a58d3d2aSXin Li   intensity = ctx->intensity;
*a58d3d2aSXin Li   ec = ctx->ec;
*a58d3d2aSXin Li   bandE = ctx->bandE;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Decide on the resolution to give to the split parameter theta */
*a58d3d2aSXin Li   pulse_cap = m->logN[i]+LM*(1<<BITRES);
*a58d3d2aSXin Li   offset = (pulse_cap>>1) - (stereo&&N==2 ? QTHETA_OFFSET_TWOPHASE : QTHETA_OFFSET);
*a58d3d2aSXin Li   qn = compute_qn(N, *b, offset, pulse_cap, stereo);
*a58d3d2aSXin Li   if (stereo && i>=intensity)
*a58d3d2aSXin Li      qn = 1;
*a58d3d2aSXin Li   if (encode)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      /* theta is the atan() of the ratio between the (normalized)
*a58d3d2aSXin Li         side and mid. With just that parameter, we can re-scale both
*a58d3d2aSXin Li         mid and side because we know that 1) they have unit norm and
*a58d3d2aSXin Li         2) they are orthogonal. */
*a58d3d2aSXin Li      itheta = stereo_itheta(X, Y, stereo, N, ctx->arch);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   tell = ec_tell_frac(ec);
*a58d3d2aSXin Li   if (qn!=1)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      if (encode)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         if (!stereo || ctx->theta_round == 0)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            itheta = (itheta*(opus_int32)qn+8192)>>14;
*a58d3d2aSXin Li            if (!stereo && ctx->avoid_split_noise && itheta > 0 && itheta < qn)
*a58d3d2aSXin Li            {
*a58d3d2aSXin Li               /* Check if the selected value of theta will cause the bit allocation
*a58d3d2aSXin Li                  to inject noise on one side. If so, make sure the energy of that side
*a58d3d2aSXin Li                  is zero. */
*a58d3d2aSXin Li               int unquantized = celt_udiv((opus_int32)itheta*16384, qn);
*a58d3d2aSXin Li               imid = bitexact_cos((opus_int16)unquantized);
*a58d3d2aSXin Li               iside = bitexact_cos((opus_int16)(16384-unquantized));
*a58d3d2aSXin Li               delta = FRAC_MUL16((N-1)<<7,bitexact_log2tan(iside,imid));
*a58d3d2aSXin Li               if (delta > *b)
*a58d3d2aSXin Li                  itheta = qn;
*a58d3d2aSXin Li               else if (delta < -*b)
*a58d3d2aSXin Li                  itheta = 0;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            int down;
*a58d3d2aSXin Li            /* Bias quantization towards itheta=0 and itheta=16384. */
*a58d3d2aSXin Li            int bias = itheta > 8192 ? 32767/qn : -32767/qn;
*a58d3d2aSXin Li            down = IMIN(qn-1, IMAX(0, (itheta*(opus_int32)qn + bias)>>14));
*a58d3d2aSXin Li            if (ctx->theta_round < 0)
*a58d3d2aSXin Li               itheta = down;
*a58d3d2aSXin Li            else
*a58d3d2aSXin Li               itheta = down+1;
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      /* Entropy coding of the angle. We use a uniform pdf for the
*a58d3d2aSXin Li         time split, a step for stereo, and a triangular one for the rest. */
*a58d3d2aSXin Li      if (stereo && N>2)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int p0 = 3;
*a58d3d2aSXin Li         int x = itheta;
*a58d3d2aSXin Li         int x0 = qn/2;
*a58d3d2aSXin Li         int ft = p0*(x0+1) + x0;
*a58d3d2aSXin Li         /* Use a probability of p0 up to itheta=8192 and then use 1 after */
*a58d3d2aSXin Li         if (encode)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            ec_encode(ec,x<=x0?p0*x:(x-1-x0)+(x0+1)*p0,x<=x0?p0*(x+1):(x-x0)+(x0+1)*p0,ft);
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            int fs;
*a58d3d2aSXin Li            fs=ec_decode(ec,ft);
*a58d3d2aSXin Li            if (fs<(x0+1)*p0)
*a58d3d2aSXin Li               x=fs/p0;
*a58d3d2aSXin Li            else
*a58d3d2aSXin Li               x=x0+1+(fs-(x0+1)*p0);
*a58d3d2aSXin Li            ec_dec_update(ec,x<=x0?p0*x:(x-1-x0)+(x0+1)*p0,x<=x0?p0*(x+1):(x-x0)+(x0+1)*p0,ft);
*a58d3d2aSXin Li            itheta = x;
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li      } else if (B0>1 || stereo) {
*a58d3d2aSXin Li         /* Uniform pdf */
*a58d3d2aSXin Li         if (encode)
*a58d3d2aSXin Li            ec_enc_uint(ec, itheta, qn+1);
*a58d3d2aSXin Li         else
*a58d3d2aSXin Li            itheta = ec_dec_uint(ec, qn+1);
*a58d3d2aSXin Li      } else {
*a58d3d2aSXin Li         int fs=1, ft;
*a58d3d2aSXin Li         ft = ((qn>>1)+1)*((qn>>1)+1);
*a58d3d2aSXin Li         if (encode)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            int fl;
*a58d3d2aSXin Li
*a58d3d2aSXin Li            fs = itheta <= (qn>>1) ? itheta + 1 : qn + 1 - itheta;
*a58d3d2aSXin Li            fl = itheta <= (qn>>1) ? itheta*(itheta + 1)>>1 :
*a58d3d2aSXin Li             ft - ((qn + 1 - itheta)*(qn + 2 - itheta)>>1);
*a58d3d2aSXin Li
*a58d3d2aSXin Li            ec_encode(ec, fl, fl+fs, ft);
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            /* Triangular pdf */
*a58d3d2aSXin Li            int fl=0;
*a58d3d2aSXin Li            int fm;
*a58d3d2aSXin Li            fm = ec_decode(ec, ft);
*a58d3d2aSXin Li
*a58d3d2aSXin Li            if (fm < ((qn>>1)*((qn>>1) + 1)>>1))
*a58d3d2aSXin Li            {
*a58d3d2aSXin Li               itheta = (isqrt32(8*(opus_uint32)fm + 1) - 1)>>1;
*a58d3d2aSXin Li               fs = itheta + 1;
*a58d3d2aSXin Li               fl = itheta*(itheta + 1)>>1;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li            else
*a58d3d2aSXin Li            {
*a58d3d2aSXin Li               itheta = (2*(qn + 1)
*a58d3d2aSXin Li                - isqrt32(8*(opus_uint32)(ft - fm - 1) + 1))>>1;
*a58d3d2aSXin Li               fs = qn + 1 - itheta;
*a58d3d2aSXin Li               fl = ft - ((qn + 1 - itheta)*(qn + 2 - itheta)>>1);
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li
*a58d3d2aSXin Li            ec_dec_update(ec, fl, fl+fs, ft);
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      celt_assert(itheta>=0);
*a58d3d2aSXin Li      itheta = celt_udiv((opus_int32)itheta*16384, qn);
*a58d3d2aSXin Li      if (encode && stereo)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         if (itheta==0)
*a58d3d2aSXin Li            intensity_stereo(m, X, Y, bandE, i, N);
*a58d3d2aSXin Li         else
*a58d3d2aSXin Li            stereo_split(X, Y, N);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      /* NOTE: Renormalising X and Y *may* help fixed-point a bit at very high rate.
*a58d3d2aSXin Li               Let's do that at higher complexity */
*a58d3d2aSXin Li   } else if (stereo) {
*a58d3d2aSXin Li      if (encode)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         inv = itheta > 8192 && !ctx->disable_inv;
*a58d3d2aSXin Li         if (inv)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            int j;
*a58d3d2aSXin Li            for (j=0;j<N;j++)
*a58d3d2aSXin Li               Y[j] = -Y[j];
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li         intensity_stereo(m, X, Y, bandE, i, N);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      if (*b>2<<BITRES && ctx->remaining_bits > 2<<BITRES)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         if (encode)
*a58d3d2aSXin Li            ec_enc_bit_logp(ec, inv, 2);
*a58d3d2aSXin Li         else
*a58d3d2aSXin Li            inv = ec_dec_bit_logp(ec, 2);
*a58d3d2aSXin Li      } else
*a58d3d2aSXin Li         inv = 0;
*a58d3d2aSXin Li      /* inv flag override to avoid problems with downmixing. */
*a58d3d2aSXin Li      if (ctx->disable_inv)
*a58d3d2aSXin Li         inv = 0;
*a58d3d2aSXin Li      itheta = 0;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   qalloc = ec_tell_frac(ec) - tell;
*a58d3d2aSXin Li   *b -= qalloc;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   if (itheta == 0)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      imid = 32767;
*a58d3d2aSXin Li      iside = 0;
*a58d3d2aSXin Li      *fill &= (1<<B)-1;
*a58d3d2aSXin Li      delta = -16384;
*a58d3d2aSXin Li   } else if (itheta == 16384)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      imid = 0;
*a58d3d2aSXin Li      iside = 32767;
*a58d3d2aSXin Li      *fill &= ((1<<B)-1)<<B;
*a58d3d2aSXin Li      delta = 16384;
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      imid = bitexact_cos((opus_int16)itheta);
*a58d3d2aSXin Li      iside = bitexact_cos((opus_int16)(16384-itheta));
*a58d3d2aSXin Li      /* This is the mid vs side allocation that minimizes squared error
*a58d3d2aSXin Li         in that band. */
*a58d3d2aSXin Li      delta = FRAC_MUL16((N-1)<<7,bitexact_log2tan(iside,imid));
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li   sctx->inv = inv;
*a58d3d2aSXin Li   sctx->imid = imid;
*a58d3d2aSXin Li   sctx->iside = iside;
*a58d3d2aSXin Li   sctx->delta = delta;
*a58d3d2aSXin Li   sctx->itheta = itheta;
*a58d3d2aSXin Li   sctx->qalloc = qalloc;
*a58d3d2aSXin Li}
*a58d3d2aSXin Listatic unsigned quant_band_n1(struct band_ctx *ctx, celt_norm *X, celt_norm *Y,
*a58d3d2aSXin Li      celt_norm *lowband_out)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int c;
*a58d3d2aSXin Li   int stereo;
*a58d3d2aSXin Li   celt_norm *x = X;
*a58d3d2aSXin Li   int encode;
*a58d3d2aSXin Li   ec_ctx *ec;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   encode = ctx->encode;
*a58d3d2aSXin Li   ec = ctx->ec;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   stereo = Y != NULL;
*a58d3d2aSXin Li   c=0; do {
*a58d3d2aSXin Li      int sign=0;
*a58d3d2aSXin Li      if (ctx->remaining_bits>=1<<BITRES)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         if (encode)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            sign = x[0]<0;
*a58d3d2aSXin Li            ec_enc_bits(ec, sign, 1);
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            sign = ec_dec_bits(ec, 1);
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li         ctx->remaining_bits -= 1<<BITRES;
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      if (ctx->resynth)
*a58d3d2aSXin Li         x[0] = sign ? -NORM_SCALING : NORM_SCALING;
*a58d3d2aSXin Li      x = Y;
*a58d3d2aSXin Li   } while (++c<1+stereo);
*a58d3d2aSXin Li   if (lowband_out)
*a58d3d2aSXin Li      lowband_out[0] = SHR16(X[0],4);
*a58d3d2aSXin Li   return 1;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* This function is responsible for encoding and decoding a mono partition.
*a58d3d2aSXin Li   It can split the band in two and transmit the energy difference with
*a58d3d2aSXin Li   the two half-bands. It can be called recursively so bands can end up being
*a58d3d2aSXin Li   split in 8 parts. */
*a58d3d2aSXin Listatic unsigned quant_partition(struct band_ctx *ctx, celt_norm *X,
*a58d3d2aSXin Li      int N, int b, int B, celt_norm *lowband,
*a58d3d2aSXin Li      int LM,
*a58d3d2aSXin Li      opus_val16 gain, int fill)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   const unsigned char *cache;
*a58d3d2aSXin Li   int q;
*a58d3d2aSXin Li   int curr_bits;
*a58d3d2aSXin Li   int imid=0, iside=0;
*a58d3d2aSXin Li   int B0=B;
*a58d3d2aSXin Li   opus_val16 mid=0, side=0;
*a58d3d2aSXin Li   unsigned cm=0;
*a58d3d2aSXin Li   celt_norm *Y=NULL;
*a58d3d2aSXin Li   int encode;
*a58d3d2aSXin Li   const CELTMode *m;
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   int spread;
*a58d3d2aSXin Li   ec_ctx *ec;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   encode = ctx->encode;
*a58d3d2aSXin Li   m = ctx->m;
*a58d3d2aSXin Li   i = ctx->i;
*a58d3d2aSXin Li   spread = ctx->spread;
*a58d3d2aSXin Li   ec = ctx->ec;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* If we need 1.5 more bit than we can produce, split the band in two. */
*a58d3d2aSXin Li   cache = m->cache.bits + m->cache.index[(LM+1)*m->nbEBands+i];
*a58d3d2aSXin Li   if (LM != -1 && b > cache[cache[0]]+12 && N>2)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      int mbits, sbits, delta;
*a58d3d2aSXin Li      int itheta;
*a58d3d2aSXin Li      int qalloc;
*a58d3d2aSXin Li      struct split_ctx sctx;
*a58d3d2aSXin Li      celt_norm *next_lowband2=NULL;
*a58d3d2aSXin Li      opus_int32 rebalance;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      N >>= 1;
*a58d3d2aSXin Li      Y = X+N;
*a58d3d2aSXin Li      LM -= 1;
*a58d3d2aSXin Li      if (B==1)
*a58d3d2aSXin Li         fill = (fill&1)|(fill<<1);
*a58d3d2aSXin Li      B = (B+1)>>1;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      compute_theta(ctx, &sctx, X, Y, N, &b, B, B0, LM, 0, &fill);
*a58d3d2aSXin Li      imid = sctx.imid;
*a58d3d2aSXin Li      iside = sctx.iside;
*a58d3d2aSXin Li      delta = sctx.delta;
*a58d3d2aSXin Li      itheta = sctx.itheta;
*a58d3d2aSXin Li      qalloc = sctx.qalloc;
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li      mid = imid;
*a58d3d2aSXin Li      side = iside;
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li      mid = (1.f/32768)*imid;
*a58d3d2aSXin Li      side = (1.f/32768)*iside;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li      /* Give more bits to low-energy MDCTs than they would otherwise deserve */
*a58d3d2aSXin Li      if (B0>1 && (itheta&0x3fff))
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         if (itheta > 8192)
*a58d3d2aSXin Li            /* Rough approximation for pre-echo masking */
*a58d3d2aSXin Li            delta -= delta>>(4-LM);
*a58d3d2aSXin Li         else
*a58d3d2aSXin Li            /* Corresponds to a forward-masking slope of 1.5 dB per 10 ms */
*a58d3d2aSXin Li            delta = IMIN(0, delta + (N<<BITRES>>(5-LM)));
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      mbits = IMAX(0, IMIN(b, (b-delta)/2));
*a58d3d2aSXin Li      sbits = b-mbits;
*a58d3d2aSXin Li      ctx->remaining_bits -= qalloc;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      if (lowband)
*a58d3d2aSXin Li         next_lowband2 = lowband+N; /* >32-bit split case */
*a58d3d2aSXin Li
*a58d3d2aSXin Li      rebalance = ctx->remaining_bits;
*a58d3d2aSXin Li      if (mbits >= sbits)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         cm = quant_partition(ctx, X, N, mbits, B, lowband, LM,
*a58d3d2aSXin Li               MULT16_16_P15(gain,mid), fill);
*a58d3d2aSXin Li         rebalance = mbits - (rebalance-ctx->remaining_bits);
*a58d3d2aSXin Li         if (rebalance > 3<<BITRES && itheta!=0)
*a58d3d2aSXin Li            sbits += rebalance - (3<<BITRES);
*a58d3d2aSXin Li         cm |= quant_partition(ctx, Y, N, sbits, B, next_lowband2, LM,
*a58d3d2aSXin Li               MULT16_16_P15(gain,side), fill>>B)<<(B0>>1);
*a58d3d2aSXin Li      } else {
*a58d3d2aSXin Li         cm = quant_partition(ctx, Y, N, sbits, B, next_lowband2, LM,
*a58d3d2aSXin Li               MULT16_16_P15(gain,side), fill>>B)<<(B0>>1);
*a58d3d2aSXin Li         rebalance = sbits - (rebalance-ctx->remaining_bits);
*a58d3d2aSXin Li         if (rebalance > 3<<BITRES && itheta!=16384)
*a58d3d2aSXin Li            mbits += rebalance - (3<<BITRES);
*a58d3d2aSXin Li         cm |= quant_partition(ctx, X, N, mbits, B, lowband, LM,
*a58d3d2aSXin Li               MULT16_16_P15(gain,mid), fill);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      /* This is the basic no-split case */
*a58d3d2aSXin Li      q = bits2pulses(m, i, LM, b);
*a58d3d2aSXin Li      curr_bits = pulses2bits(m, i, LM, q);
*a58d3d2aSXin Li      ctx->remaining_bits -= curr_bits;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      /* Ensures we can never bust the budget */
*a58d3d2aSXin Li      while (ctx->remaining_bits < 0 && q > 0)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         ctx->remaining_bits += curr_bits;
*a58d3d2aSXin Li         q--;
*a58d3d2aSXin Li         curr_bits = pulses2bits(m, i, LM, q);
*a58d3d2aSXin Li         ctx->remaining_bits -= curr_bits;
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li
*a58d3d2aSXin Li      if (q!=0)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int K = get_pulses(q);
*a58d3d2aSXin Li
*a58d3d2aSXin Li         /* Finally do the actual quantization */
*a58d3d2aSXin Li         if (encode)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            cm = alg_quant(X, N, K, spread, B, ec, gain, ctx->resynth, ctx->arch);
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            cm = alg_unquant(X, N, K, spread, B, ec, gain);
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li      } else {
*a58d3d2aSXin Li         /* If there's no pulse, fill the band anyway */
*a58d3d2aSXin Li         int j;
*a58d3d2aSXin Li         if (ctx->resynth)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            unsigned cm_mask;
*a58d3d2aSXin Li            /* B can be as large as 16, so this shift might overflow an int on a
*a58d3d2aSXin Li               16-bit platform; use a long to get defined behavior.*/
*a58d3d2aSXin Li            cm_mask = (unsigned)(1UL<<B)-1;
*a58d3d2aSXin Li            fill &= cm_mask;
*a58d3d2aSXin Li            if (!fill)
*a58d3d2aSXin Li            {
*a58d3d2aSXin Li               OPUS_CLEAR(X, N);
*a58d3d2aSXin Li            } else {
*a58d3d2aSXin Li               if (lowband == NULL)
*a58d3d2aSXin Li               {
*a58d3d2aSXin Li                  /* Noise */
*a58d3d2aSXin Li                  for (j=0;j<N;j++)
*a58d3d2aSXin Li                  {
*a58d3d2aSXin Li                     ctx->seed = celt_lcg_rand(ctx->seed);
*a58d3d2aSXin Li                     X[j] = (celt_norm)((opus_int32)ctx->seed>>20);
*a58d3d2aSXin Li                  }
*a58d3d2aSXin Li                  cm = cm_mask;
*a58d3d2aSXin Li               } else {
*a58d3d2aSXin Li                  /* Folded spectrum */
*a58d3d2aSXin Li                  for (j=0;j<N;j++)
*a58d3d2aSXin Li                  {
*a58d3d2aSXin Li                     opus_val16 tmp;
*a58d3d2aSXin Li                     ctx->seed = celt_lcg_rand(ctx->seed);
*a58d3d2aSXin Li                     /* About 48 dB below the "normal" folding level */
*a58d3d2aSXin Li                     tmp = QCONST16(1.0f/256, 10);
*a58d3d2aSXin Li                     tmp = (ctx->seed)&0x8000 ? tmp : -tmp;
*a58d3d2aSXin Li                     X[j] = lowband[j]+tmp;
*a58d3d2aSXin Li                  }
*a58d3d2aSXin Li                  cm = fill;
*a58d3d2aSXin Li               }
*a58d3d2aSXin Li               renormalise_vector(X, N, gain, ctx->arch);
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li   return cm;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* This function is responsible for encoding and decoding a band for the mono case. */
*a58d3d2aSXin Listatic unsigned quant_band(struct band_ctx *ctx, celt_norm *X,
*a58d3d2aSXin Li      int N, int b, int B, celt_norm *lowband,
*a58d3d2aSXin Li      int LM, celt_norm *lowband_out,
*a58d3d2aSXin Li      opus_val16 gain, celt_norm *lowband_scratch, int fill)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int N0=N;
*a58d3d2aSXin Li   int N_B=N;
*a58d3d2aSXin Li   int N_B0;
*a58d3d2aSXin Li   int B0=B;
*a58d3d2aSXin Li   int time_divide=0;
*a58d3d2aSXin Li   int recombine=0;
*a58d3d2aSXin Li   int longBlocks;
*a58d3d2aSXin Li   unsigned cm=0;
*a58d3d2aSXin Li   int k;
*a58d3d2aSXin Li   int encode;
*a58d3d2aSXin Li   int tf_change;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   encode = ctx->encode;
*a58d3d2aSXin Li   tf_change = ctx->tf_change;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   longBlocks = B0==1;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   N_B = celt_udiv(N_B, B);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Special case for one sample */
*a58d3d2aSXin Li   if (N==1)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      return quant_band_n1(ctx, X, NULL, lowband_out);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li   if (tf_change>0)
*a58d3d2aSXin Li      recombine = tf_change;
*a58d3d2aSXin Li   /* Band recombining to increase frequency resolution */
*a58d3d2aSXin Li
*a58d3d2aSXin Li   if (lowband_scratch && lowband && (recombine || ((N_B&1) == 0 && tf_change<0) || B0>1))
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      OPUS_COPY(lowband_scratch, lowband, N);
*a58d3d2aSXin Li      lowband = lowband_scratch;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li   for (k=0;k<recombine;k++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      static const unsigned char bit_interleave_table[16]={
*a58d3d2aSXin Li            0,1,1,1,2,3,3,3,2,3,3,3,2,3,3,3
*a58d3d2aSXin Li      };
*a58d3d2aSXin Li      if (encode)
*a58d3d2aSXin Li         haar1(X, N>>k, 1<<k);
*a58d3d2aSXin Li      if (lowband)
*a58d3d2aSXin Li         haar1(lowband, N>>k, 1<<k);
*a58d3d2aSXin Li      fill = bit_interleave_table[fill&0xF]|bit_interleave_table[fill>>4]<<2;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   B>>=recombine;
*a58d3d2aSXin Li   N_B<<=recombine;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Increasing the time resolution */
*a58d3d2aSXin Li   while ((N_B&1) == 0 && tf_change<0)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      if (encode)
*a58d3d2aSXin Li         haar1(X, N_B, B);
*a58d3d2aSXin Li      if (lowband)
*a58d3d2aSXin Li         haar1(lowband, N_B, B);
*a58d3d2aSXin Li      fill |= fill<<B;
*a58d3d2aSXin Li      B <<= 1;
*a58d3d2aSXin Li      N_B >>= 1;
*a58d3d2aSXin Li      time_divide++;
*a58d3d2aSXin Li      tf_change++;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   B0=B;
*a58d3d2aSXin Li   N_B0 = N_B;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Reorganize the samples in time order instead of frequency order */
*a58d3d2aSXin Li   if (B0>1)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      if (encode)
*a58d3d2aSXin Li         deinterleave_hadamard(X, N_B>>recombine, B0<<recombine, longBlocks);
*a58d3d2aSXin Li      if (lowband)
*a58d3d2aSXin Li         deinterleave_hadamard(lowband, N_B>>recombine, B0<<recombine, longBlocks);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li   cm = quant_partition(ctx, X, N, b, B, lowband, LM, gain, fill);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* This code is used by the decoder and by the resynthesis-enabled encoder */
*a58d3d2aSXin Li   if (ctx->resynth)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      /* Undo the sample reorganization going from time order to frequency order */
*a58d3d2aSXin Li      if (B0>1)
*a58d3d2aSXin Li         interleave_hadamard(X, N_B>>recombine, B0<<recombine, longBlocks);
*a58d3d2aSXin Li
*a58d3d2aSXin Li      /* Undo time-freq changes that we did earlier */
*a58d3d2aSXin Li      N_B = N_B0;
*a58d3d2aSXin Li      B = B0;
*a58d3d2aSXin Li      for (k=0;k<time_divide;k++)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         B >>= 1;
*a58d3d2aSXin Li         N_B <<= 1;
*a58d3d2aSXin Li         cm |= cm>>B;
*a58d3d2aSXin Li         haar1(X, N_B, B);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li
*a58d3d2aSXin Li      for (k=0;k<recombine;k++)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         static const unsigned char bit_deinterleave_table[16]={
*a58d3d2aSXin Li               0x00,0x03,0x0C,0x0F,0x30,0x33,0x3C,0x3F,
*a58d3d2aSXin Li               0xC0,0xC3,0xCC,0xCF,0xF0,0xF3,0xFC,0xFF
*a58d3d2aSXin Li         };
*a58d3d2aSXin Li         cm = bit_deinterleave_table[cm];
*a58d3d2aSXin Li         haar1(X, N0>>k, 1<<k);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      B<<=recombine;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      /* Scale output for later folding */
*a58d3d2aSXin Li      if (lowband_out)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int j;
*a58d3d2aSXin Li         opus_val16 n;
*a58d3d2aSXin Li         n = celt_sqrt(SHL32(EXTEND32(N0),22));
*a58d3d2aSXin Li         for (j=0;j<N0;j++)
*a58d3d2aSXin Li            lowband_out[j] = MULT16_16_Q15(n,X[j]);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      cm &= (1<<B)-1;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   return cm;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* This function is responsible for encoding and decoding a band for the stereo case. */
*a58d3d2aSXin Listatic unsigned quant_band_stereo(struct band_ctx *ctx, celt_norm *X, celt_norm *Y,
*a58d3d2aSXin Li      int N, int b, int B, celt_norm *lowband,
*a58d3d2aSXin Li      int LM, celt_norm *lowband_out,
*a58d3d2aSXin Li      celt_norm *lowband_scratch, int fill)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int imid=0, iside=0;
*a58d3d2aSXin Li   int inv = 0;
*a58d3d2aSXin Li   opus_val16 mid=0, side=0;
*a58d3d2aSXin Li   unsigned cm=0;
*a58d3d2aSXin Li   int mbits, sbits, delta;
*a58d3d2aSXin Li   int itheta;
*a58d3d2aSXin Li   int qalloc;
*a58d3d2aSXin Li   struct split_ctx sctx;
*a58d3d2aSXin Li   int orig_fill;
*a58d3d2aSXin Li   int encode;
*a58d3d2aSXin Li   ec_ctx *ec;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   encode = ctx->encode;
*a58d3d2aSXin Li   ec = ctx->ec;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* Special case for one sample */
*a58d3d2aSXin Li   if (N==1)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      return quant_band_n1(ctx, X, Y, lowband_out);
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li   orig_fill = fill;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   compute_theta(ctx, &sctx, X, Y, N, &b, B, B, LM, 1, &fill);
*a58d3d2aSXin Li   inv = sctx.inv;
*a58d3d2aSXin Li   imid = sctx.imid;
*a58d3d2aSXin Li   iside = sctx.iside;
*a58d3d2aSXin Li   delta = sctx.delta;
*a58d3d2aSXin Li   itheta = sctx.itheta;
*a58d3d2aSXin Li   qalloc = sctx.qalloc;
*a58d3d2aSXin Li#ifdef FIXED_POINT
*a58d3d2aSXin Li   mid = imid;
*a58d3d2aSXin Li   side = iside;
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li   mid = (1.f/32768)*imid;
*a58d3d2aSXin Li   side = (1.f/32768)*iside;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* This is a special case for N=2 that only works for stereo and takes
*a58d3d2aSXin Li      advantage of the fact that mid and side are orthogonal to encode
*a58d3d2aSXin Li      the side with just one bit. */
*a58d3d2aSXin Li   if (N==2)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      int c;
*a58d3d2aSXin Li      int sign=0;
*a58d3d2aSXin Li      celt_norm *x2, *y2;
*a58d3d2aSXin Li      mbits = b;
*a58d3d2aSXin Li      sbits = 0;
*a58d3d2aSXin Li      /* Only need one bit for the side. */
*a58d3d2aSXin Li      if (itheta != 0 && itheta != 16384)
*a58d3d2aSXin Li         sbits = 1<<BITRES;
*a58d3d2aSXin Li      mbits -= sbits;
*a58d3d2aSXin Li      c = itheta > 8192;
*a58d3d2aSXin Li      ctx->remaining_bits -= qalloc+sbits;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      x2 = c ? Y : X;
*a58d3d2aSXin Li      y2 = c ? X : Y;
*a58d3d2aSXin Li      if (sbits)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         if (encode)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            /* Here we only need to encode a sign for the side. */
*a58d3d2aSXin Li            sign = x2[0]*y2[1] - x2[1]*y2[0] < 0;
*a58d3d2aSXin Li            ec_enc_bits(ec, sign, 1);
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            sign = ec_dec_bits(ec, 1);
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      sign = 1-2*sign;
*a58d3d2aSXin Li      /* We use orig_fill here because we want to fold the side, but if
*a58d3d2aSXin Li         itheta==16384, we'll have cleared the low bits of fill. */
*a58d3d2aSXin Li      cm = quant_band(ctx, x2, N, mbits, B, lowband, LM, lowband_out, Q15ONE,
*a58d3d2aSXin Li            lowband_scratch, orig_fill);
*a58d3d2aSXin Li      /* We don't split N=2 bands, so cm is either 1 or 0 (for a fold-collapse),
*a58d3d2aSXin Li         and there's no need to worry about mixing with the other channel. */
*a58d3d2aSXin Li      y2[0] = -sign*x2[1];
*a58d3d2aSXin Li      y2[1] = sign*x2[0];
*a58d3d2aSXin Li      if (ctx->resynth)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         celt_norm tmp;
*a58d3d2aSXin Li         X[0] = MULT16_16_Q15(mid, X[0]);
*a58d3d2aSXin Li         X[1] = MULT16_16_Q15(mid, X[1]);
*a58d3d2aSXin Li         Y[0] = MULT16_16_Q15(side, Y[0]);
*a58d3d2aSXin Li         Y[1] = MULT16_16_Q15(side, Y[1]);
*a58d3d2aSXin Li         tmp = X[0];
*a58d3d2aSXin Li         X[0] = SUB16(tmp,Y[0]);
*a58d3d2aSXin Li         Y[0] = ADD16(tmp,Y[0]);
*a58d3d2aSXin Li         tmp = X[1];
*a58d3d2aSXin Li         X[1] = SUB16(tmp,Y[1]);
*a58d3d2aSXin Li         Y[1] = ADD16(tmp,Y[1]);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   } else {
*a58d3d2aSXin Li      /* "Normal" split code */
*a58d3d2aSXin Li      opus_int32 rebalance;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      mbits = IMAX(0, IMIN(b, (b-delta)/2));
*a58d3d2aSXin Li      sbits = b-mbits;
*a58d3d2aSXin Li      ctx->remaining_bits -= qalloc;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      rebalance = ctx->remaining_bits;
*a58d3d2aSXin Li      if (mbits >= sbits)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         /* In stereo mode, we do not apply a scaling to the mid because we need the normalized
*a58d3d2aSXin Li            mid for folding later. */
*a58d3d2aSXin Li         cm = quant_band(ctx, X, N, mbits, B, lowband, LM, lowband_out, Q15ONE,
*a58d3d2aSXin Li               lowband_scratch, fill);
*a58d3d2aSXin Li         rebalance = mbits - (rebalance-ctx->remaining_bits);
*a58d3d2aSXin Li         if (rebalance > 3<<BITRES && itheta!=0)
*a58d3d2aSXin Li            sbits += rebalance - (3<<BITRES);
*a58d3d2aSXin Li
*a58d3d2aSXin Li         /* For a stereo split, the high bits of fill are always zero, so no
*a58d3d2aSXin Li            folding will be done to the side. */
*a58d3d2aSXin Li         cm |= quant_band(ctx, Y, N, sbits, B, NULL, LM, NULL, side, NULL, fill>>B);
*a58d3d2aSXin Li      } else {
*a58d3d2aSXin Li         /* For a stereo split, the high bits of fill are always zero, so no
*a58d3d2aSXin Li            folding will be done to the side. */
*a58d3d2aSXin Li         cm = quant_band(ctx, Y, N, sbits, B, NULL, LM, NULL, side, NULL, fill>>B);
*a58d3d2aSXin Li         rebalance = sbits - (rebalance-ctx->remaining_bits);
*a58d3d2aSXin Li         if (rebalance > 3<<BITRES && itheta!=16384)
*a58d3d2aSXin Li            mbits += rebalance - (3<<BITRES);
*a58d3d2aSXin Li         /* In stereo mode, we do not apply a scaling to the mid because we need the normalized
*a58d3d2aSXin Li            mid for folding later. */
*a58d3d2aSXin Li         cm |= quant_band(ctx, X, N, mbits, B, lowband, LM, lowband_out, Q15ONE,
*a58d3d2aSXin Li               lowband_scratch, fill);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* This code is used by the decoder and by the resynthesis-enabled encoder */
*a58d3d2aSXin Li   if (ctx->resynth)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      if (N!=2)
*a58d3d2aSXin Li         stereo_merge(X, Y, mid, N, ctx->arch);
*a58d3d2aSXin Li      if (inv)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int j;
*a58d3d2aSXin Li         for (j=0;j<N;j++)
*a58d3d2aSXin Li            Y[j] = -Y[j];
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   return cm;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef DISABLE_UPDATE_DRAFT
*a58d3d2aSXin Listatic void special_hybrid_folding(const CELTMode *m, celt_norm *norm, celt_norm *norm2, int start, int M, int dual_stereo)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int n1, n2;
*a58d3d2aSXin Li   const opus_int16 * OPUS_RESTRICT eBands = m->eBands;
*a58d3d2aSXin Li   n1 = M*(eBands[start+1]-eBands[start]);
*a58d3d2aSXin Li   n2 = M*(eBands[start+2]-eBands[start+1]);
*a58d3d2aSXin Li   /* Duplicate enough of the first band folding data to be able to fold the second band.
*a58d3d2aSXin Li      Copies no data for CELT-only mode. */
*a58d3d2aSXin Li   OPUS_COPY(&norm[n1], &norm[2*n1 - n2], n2-n1);
*a58d3d2aSXin Li   if (dual_stereo)
*a58d3d2aSXin Li      OPUS_COPY(&norm2[n1], &norm2[2*n1 - n2], n2-n1);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid quant_all_bands(int encode, const CELTMode *m, int start, int end,
*a58d3d2aSXin Li      celt_norm *X_, celt_norm *Y_, unsigned char *collapse_masks,
*a58d3d2aSXin Li      const celt_ener *bandE, int *pulses, int shortBlocks, int spread,
*a58d3d2aSXin Li      int dual_stereo, int intensity, int *tf_res, opus_int32 total_bits,
*a58d3d2aSXin Li      opus_int32 balance, ec_ctx *ec, int LM, int codedBands,
*a58d3d2aSXin Li      opus_uint32 *seed, int complexity, int arch, int disable_inv)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li   int i;
*a58d3d2aSXin Li   opus_int32 remaining_bits;
*a58d3d2aSXin Li   const opus_int16 * OPUS_RESTRICT eBands = m->eBands;
*a58d3d2aSXin Li   celt_norm * OPUS_RESTRICT norm, * OPUS_RESTRICT norm2;
*a58d3d2aSXin Li   VARDECL(celt_norm, _norm);
*a58d3d2aSXin Li   VARDECL(celt_norm, _lowband_scratch);
*a58d3d2aSXin Li   VARDECL(celt_norm, X_save);
*a58d3d2aSXin Li   VARDECL(celt_norm, Y_save);
*a58d3d2aSXin Li   VARDECL(celt_norm, X_save2);
*a58d3d2aSXin Li   VARDECL(celt_norm, Y_save2);
*a58d3d2aSXin Li   VARDECL(celt_norm, norm_save2);
*a58d3d2aSXin Li   int resynth_alloc;
*a58d3d2aSXin Li   celt_norm *lowband_scratch;
*a58d3d2aSXin Li   int B;
*a58d3d2aSXin Li   int M;
*a58d3d2aSXin Li   int lowband_offset;
*a58d3d2aSXin Li   int update_lowband = 1;
*a58d3d2aSXin Li   int C = Y_ != NULL ? 2 : 1;
*a58d3d2aSXin Li   int norm_offset;
*a58d3d2aSXin Li   int theta_rdo = encode && Y_!=NULL && !dual_stereo && complexity>=8;
*a58d3d2aSXin Li#ifdef RESYNTH
*a58d3d2aSXin Li   int resynth = 1;
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li   int resynth = !encode || theta_rdo;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li   struct band_ctx ctx;
*a58d3d2aSXin Li   SAVE_STACK;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   M = 1<<LM;
*a58d3d2aSXin Li   B = shortBlocks ? M : 1;
*a58d3d2aSXin Li   norm_offset = M*eBands[start];
*a58d3d2aSXin Li   /* No need to allocate norm for the last band because we don't need an
*a58d3d2aSXin Li      output in that band. */
*a58d3d2aSXin Li   ALLOC(_norm, C*(M*eBands[m->nbEBands-1]-norm_offset), celt_norm);
*a58d3d2aSXin Li   norm = _norm;
*a58d3d2aSXin Li   norm2 = norm + M*eBands[m->nbEBands-1]-norm_offset;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   /* For decoding, we can use the last band as scratch space because we don't need that
*a58d3d2aSXin Li      scratch space for the last band and we don't care about the data there until we're
*a58d3d2aSXin Li      decoding the last band. */
*a58d3d2aSXin Li   if (encode && resynth)
*a58d3d2aSXin Li      resynth_alloc = M*(eBands[m->nbEBands]-eBands[m->nbEBands-1]);
*a58d3d2aSXin Li   else
*a58d3d2aSXin Li      resynth_alloc = ALLOC_NONE;
*a58d3d2aSXin Li   ALLOC(_lowband_scratch, resynth_alloc, celt_norm);
*a58d3d2aSXin Li   if (encode && resynth)
*a58d3d2aSXin Li      lowband_scratch = _lowband_scratch;
*a58d3d2aSXin Li   else
*a58d3d2aSXin Li      lowband_scratch = X_+M*eBands[m->effEBands-1];
*a58d3d2aSXin Li   ALLOC(X_save, resynth_alloc, celt_norm);
*a58d3d2aSXin Li   ALLOC(Y_save, resynth_alloc, celt_norm);
*a58d3d2aSXin Li   ALLOC(X_save2, resynth_alloc, celt_norm);
*a58d3d2aSXin Li   ALLOC(Y_save2, resynth_alloc, celt_norm);
*a58d3d2aSXin Li   ALLOC(norm_save2, resynth_alloc, celt_norm);
*a58d3d2aSXin Li
*a58d3d2aSXin Li   lowband_offset = 0;
*a58d3d2aSXin Li   ctx.bandE = bandE;
*a58d3d2aSXin Li   ctx.ec = ec;
*a58d3d2aSXin Li   ctx.encode = encode;
*a58d3d2aSXin Li   ctx.intensity = intensity;
*a58d3d2aSXin Li   ctx.m = m;
*a58d3d2aSXin Li   ctx.seed = *seed;
*a58d3d2aSXin Li   ctx.spread = spread;
*a58d3d2aSXin Li   ctx.arch = arch;
*a58d3d2aSXin Li   ctx.disable_inv = disable_inv;
*a58d3d2aSXin Li   ctx.resynth = resynth;
*a58d3d2aSXin Li   ctx.theta_round = 0;
*a58d3d2aSXin Li   /* Avoid injecting noise in the first band on transients. */
*a58d3d2aSXin Li   ctx.avoid_split_noise = B > 1;
*a58d3d2aSXin Li   for (i=start;i<end;i++)
*a58d3d2aSXin Li   {
*a58d3d2aSXin Li      opus_int32 tell;
*a58d3d2aSXin Li      int b;
*a58d3d2aSXin Li      int N;
*a58d3d2aSXin Li      opus_int32 curr_balance;
*a58d3d2aSXin Li      int effective_lowband=-1;
*a58d3d2aSXin Li      celt_norm * OPUS_RESTRICT X, * OPUS_RESTRICT Y;
*a58d3d2aSXin Li      int tf_change=0;
*a58d3d2aSXin Li      unsigned x_cm;
*a58d3d2aSXin Li      unsigned y_cm;
*a58d3d2aSXin Li      int last;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      ctx.i = i;
*a58d3d2aSXin Li      last = (i==end-1);
*a58d3d2aSXin Li
*a58d3d2aSXin Li      X = X_+M*eBands[i];
*a58d3d2aSXin Li      if (Y_!=NULL)
*a58d3d2aSXin Li         Y = Y_+M*eBands[i];
*a58d3d2aSXin Li      else
*a58d3d2aSXin Li         Y = NULL;
*a58d3d2aSXin Li      N = M*eBands[i+1]-M*eBands[i];
*a58d3d2aSXin Li      celt_assert(N > 0);
*a58d3d2aSXin Li      tell = ec_tell_frac(ec);
*a58d3d2aSXin Li
*a58d3d2aSXin Li      /* Compute how many bits we want to allocate to this band */
*a58d3d2aSXin Li      if (i != start)
*a58d3d2aSXin Li         balance -= tell;
*a58d3d2aSXin Li      remaining_bits = total_bits-tell-1;
*a58d3d2aSXin Li      ctx.remaining_bits = remaining_bits;
*a58d3d2aSXin Li      if (i <= codedBands-1)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         curr_balance = celt_sudiv(balance, IMIN(3, codedBands-i));
*a58d3d2aSXin Li         b = IMAX(0, IMIN(16383, IMIN(remaining_bits+1,pulses[i]+curr_balance)));
*a58d3d2aSXin Li      } else {
*a58d3d2aSXin Li         b = 0;
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifndef DISABLE_UPDATE_DRAFT
*a58d3d2aSXin Li      if (resynth && (M*eBands[i]-N >= M*eBands[start] || i==start+1) && (update_lowband || lowband_offset==0))
*a58d3d2aSXin Li            lowband_offset = i;
*a58d3d2aSXin Li      if (i == start+1)
*a58d3d2aSXin Li         special_hybrid_folding(m, norm, norm2, start, M, dual_stereo);
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li      if (resynth && M*eBands[i]-N >= M*eBands[start] && (update_lowband || lowband_offset==0))
*a58d3d2aSXin Li            lowband_offset = i;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li      tf_change = tf_res[i];
*a58d3d2aSXin Li      ctx.tf_change = tf_change;
*a58d3d2aSXin Li      if (i>=m->effEBands)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         X=norm;
*a58d3d2aSXin Li         if (Y_!=NULL)
*a58d3d2aSXin Li            Y = norm;
*a58d3d2aSXin Li         lowband_scratch = NULL;
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      if (last && !theta_rdo)
*a58d3d2aSXin Li         lowband_scratch = NULL;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      /* Get a conservative estimate of the collapse_mask's for the bands we're
*a58d3d2aSXin Li         going to be folding from. */
*a58d3d2aSXin Li      if (lowband_offset != 0 && (spread!=SPREAD_AGGRESSIVE || B>1 || tf_change<0))
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int fold_start;
*a58d3d2aSXin Li         int fold_end;
*a58d3d2aSXin Li         int fold_i;
*a58d3d2aSXin Li         /* This ensures we never repeat spectral content within one band */
*a58d3d2aSXin Li         effective_lowband = IMAX(0, M*eBands[lowband_offset]-norm_offset-N);
*a58d3d2aSXin Li         fold_start = lowband_offset;
*a58d3d2aSXin Li         while(M*eBands[--fold_start] > effective_lowband+norm_offset);
*a58d3d2aSXin Li         fold_end = lowband_offset-1;
*a58d3d2aSXin Li#ifndef DISABLE_UPDATE_DRAFT
*a58d3d2aSXin Li         while(++fold_end < i && M*eBands[fold_end] < effective_lowband+norm_offset+N);
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li         while(M*eBands[++fold_end] < effective_lowband+norm_offset+N);
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li         x_cm = y_cm = 0;
*a58d3d2aSXin Li         fold_i = fold_start; do {
*a58d3d2aSXin Li           x_cm |= collapse_masks[fold_i*C+0];
*a58d3d2aSXin Li           y_cm |= collapse_masks[fold_i*C+C-1];
*a58d3d2aSXin Li         } while (++fold_i<fold_end);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      /* Otherwise, we'll be using the LCG to fold, so all blocks will (almost
*a58d3d2aSXin Li         always) be non-zero. */
*a58d3d2aSXin Li      else
*a58d3d2aSXin Li         x_cm = y_cm = (1<<B)-1;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      if (dual_stereo && i==intensity)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         int j;
*a58d3d2aSXin Li
*a58d3d2aSXin Li         /* Switch off dual stereo to do intensity. */
*a58d3d2aSXin Li         dual_stereo = 0;
*a58d3d2aSXin Li         if (resynth)
*a58d3d2aSXin Li            for (j=0;j<M*eBands[i]-norm_offset;j++)
*a58d3d2aSXin Li               norm[j] = HALF32(norm[j]+norm2[j]);
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      if (dual_stereo)
*a58d3d2aSXin Li      {
*a58d3d2aSXin Li         x_cm = quant_band(&ctx, X, N, b/2, B,
*a58d3d2aSXin Li               effective_lowband != -1 ? norm+effective_lowband : NULL, LM,
*a58d3d2aSXin Li               last?NULL:norm+M*eBands[i]-norm_offset, Q15ONE, lowband_scratch, x_cm);
*a58d3d2aSXin Li         y_cm = quant_band(&ctx, Y, N, b/2, B,
*a58d3d2aSXin Li               effective_lowband != -1 ? norm2+effective_lowband : NULL, LM,
*a58d3d2aSXin Li               last?NULL:norm2+M*eBands[i]-norm_offset, Q15ONE, lowband_scratch, y_cm);
*a58d3d2aSXin Li      } else {
*a58d3d2aSXin Li         if (Y!=NULL)
*a58d3d2aSXin Li         {
*a58d3d2aSXin Li            if (theta_rdo && i < intensity)
*a58d3d2aSXin Li            {
*a58d3d2aSXin Li               ec_ctx ec_save, ec_save2;
*a58d3d2aSXin Li               struct band_ctx ctx_save, ctx_save2;
*a58d3d2aSXin Li               opus_val32 dist0, dist1;
*a58d3d2aSXin Li               unsigned cm, cm2;
*a58d3d2aSXin Li               int nstart_bytes, nend_bytes, save_bytes;
*a58d3d2aSXin Li               unsigned char *bytes_buf;
*a58d3d2aSXin Li               unsigned char bytes_save[1275];
*a58d3d2aSXin Li               opus_val16 w[2];
*a58d3d2aSXin Li               compute_channel_weights(bandE[i], bandE[i+m->nbEBands], w);
*a58d3d2aSXin Li               /* Make a copy. */
*a58d3d2aSXin Li               cm = x_cm|y_cm;
*a58d3d2aSXin Li               ec_save = *ec;
*a58d3d2aSXin Li               ctx_save = ctx;
*a58d3d2aSXin Li               OPUS_COPY(X_save, X, N);
*a58d3d2aSXin Li               OPUS_COPY(Y_save, Y, N);
*a58d3d2aSXin Li               /* Encode and round down. */
*a58d3d2aSXin Li               ctx.theta_round = -1;
*a58d3d2aSXin Li               x_cm = quant_band_stereo(&ctx, X, Y, N, b, B,
*a58d3d2aSXin Li                     effective_lowband != -1 ? norm+effective_lowband : NULL, LM,
*a58d3d2aSXin Li                     last?NULL:norm+M*eBands[i]-norm_offset, lowband_scratch, cm);
*a58d3d2aSXin Li               dist0 = MULT16_32_Q15(w[0], celt_inner_prod(X_save, X, N, arch)) + MULT16_32_Q15(w[1], celt_inner_prod(Y_save, Y, N, arch));
*a58d3d2aSXin Li
*a58d3d2aSXin Li               /* Save first result. */
*a58d3d2aSXin Li               cm2 = x_cm;
*a58d3d2aSXin Li               ec_save2 = *ec;
*a58d3d2aSXin Li               ctx_save2 = ctx;
*a58d3d2aSXin Li               OPUS_COPY(X_save2, X, N);
*a58d3d2aSXin Li               OPUS_COPY(Y_save2, Y, N);
*a58d3d2aSXin Li               if (!last)
*a58d3d2aSXin Li                  OPUS_COPY(norm_save2, norm+M*eBands[i]-norm_offset, N);
*a58d3d2aSXin Li               nstart_bytes = ec_save.offs;
*a58d3d2aSXin Li               nend_bytes = ec_save.storage;
*a58d3d2aSXin Li               bytes_buf = ec_save.buf+nstart_bytes;
*a58d3d2aSXin Li               save_bytes = nend_bytes-nstart_bytes;
*a58d3d2aSXin Li               OPUS_COPY(bytes_save, bytes_buf, save_bytes);
*a58d3d2aSXin Li
*a58d3d2aSXin Li               /* Restore */
*a58d3d2aSXin Li               *ec = ec_save;
*a58d3d2aSXin Li               ctx = ctx_save;
*a58d3d2aSXin Li               OPUS_COPY(X, X_save, N);
*a58d3d2aSXin Li               OPUS_COPY(Y, Y_save, N);
*a58d3d2aSXin Li#ifndef DISABLE_UPDATE_DRAFT
*a58d3d2aSXin Li               if (i == start+1)
*a58d3d2aSXin Li                  special_hybrid_folding(m, norm, norm2, start, M, dual_stereo);
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li               /* Encode and round up. */
*a58d3d2aSXin Li               ctx.theta_round = 1;
*a58d3d2aSXin Li               x_cm = quant_band_stereo(&ctx, X, Y, N, b, B,
*a58d3d2aSXin Li                     effective_lowband != -1 ? norm+effective_lowband : NULL, LM,
*a58d3d2aSXin Li                     last?NULL:norm+M*eBands[i]-norm_offset, lowband_scratch, cm);
*a58d3d2aSXin Li               dist1 = MULT16_32_Q15(w[0], celt_inner_prod(X_save, X, N, arch)) + MULT16_32_Q15(w[1], celt_inner_prod(Y_save, Y, N, arch));
*a58d3d2aSXin Li               if (dist0 >= dist1) {
*a58d3d2aSXin Li                  x_cm = cm2;
*a58d3d2aSXin Li                  *ec = ec_save2;
*a58d3d2aSXin Li                  ctx = ctx_save2;
*a58d3d2aSXin Li                  OPUS_COPY(X, X_save2, N);
*a58d3d2aSXin Li                  OPUS_COPY(Y, Y_save2, N);
*a58d3d2aSXin Li                  if (!last)
*a58d3d2aSXin Li                     OPUS_COPY(norm+M*eBands[i]-norm_offset, norm_save2, N);
*a58d3d2aSXin Li                  OPUS_COPY(bytes_buf, bytes_save, save_bytes);
*a58d3d2aSXin Li               }
*a58d3d2aSXin Li            } else {
*a58d3d2aSXin Li               ctx.theta_round = 0;
*a58d3d2aSXin Li               x_cm = quant_band_stereo(&ctx, X, Y, N, b, B,
*a58d3d2aSXin Li                     effective_lowband != -1 ? norm+effective_lowband : NULL, LM,
*a58d3d2aSXin Li                     last?NULL:norm+M*eBands[i]-norm_offset, lowband_scratch, x_cm|y_cm);
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li         } else {
*a58d3d2aSXin Li            x_cm = quant_band(&ctx, X, N, b, B,
*a58d3d2aSXin Li                  effective_lowband != -1 ? norm+effective_lowband : NULL, LM,
*a58d3d2aSXin Li                  last?NULL:norm+M*eBands[i]-norm_offset, Q15ONE, lowband_scratch, x_cm|y_cm);
*a58d3d2aSXin Li         }
*a58d3d2aSXin Li         y_cm = x_cm;
*a58d3d2aSXin Li      }
*a58d3d2aSXin Li      collapse_masks[i*C+0] = (unsigned char)x_cm;
*a58d3d2aSXin Li      collapse_masks[i*C+C-1] = (unsigned char)y_cm;
*a58d3d2aSXin Li      balance += pulses[i] + tell;
*a58d3d2aSXin Li
*a58d3d2aSXin Li      /* Update the folding position only as long as we have 1 bit/sample depth. */
*a58d3d2aSXin Li      update_lowband = b>(N<<BITRES);
*a58d3d2aSXin Li      /* We only need to avoid noise on a split for the first band. After that, we
*a58d3d2aSXin Li         have folding. */
*a58d3d2aSXin Li      ctx.avoid_split_noise = 0;
*a58d3d2aSXin Li   }
*a58d3d2aSXin Li   *seed = ctx.seed;
*a58d3d2aSXin Li
*a58d3d2aSXin Li   RESTORE_STACK;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li