libopus/silk/VQ_WMat_EC.c

*a58d3d2aSXin Li/***********************************************************************
*a58d3d2aSXin LiCopyright (c) 2006-2011, Skype Limited. All rights reserved.
*a58d3d2aSXin LiRedistribution and use in source and binary forms, with or without
*a58d3d2aSXin Limodification, are permitted provided that the following conditions
*a58d3d2aSXin Liare met:
*a58d3d2aSXin Li- Redistributions of source code must retain the above copyright notice,
*a58d3d2aSXin Lithis list of conditions and the following disclaimer.
*a58d3d2aSXin Li- Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Linotice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Lidocumentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li- Neither the name of Internet Society, IETF or IETF Trust, nor the
*a58d3d2aSXin Linames of specific contributors, may be used to endorse or promote
*a58d3d2aSXin Liproducts derived from this software without specific prior written
*a58d3d2aSXin Lipermission.
*a58d3d2aSXin LiTHIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
*a58d3d2aSXin LiAND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
*a58d3d2aSXin LiIMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
*a58d3d2aSXin LiARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
*a58d3d2aSXin LiLIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
*a58d3d2aSXin LiCONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
*a58d3d2aSXin LiSUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
*a58d3d2aSXin LiINTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
*a58d3d2aSXin LiCONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
*a58d3d2aSXin LiARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
*a58d3d2aSXin LiPOSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li***********************************************************************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "main.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Entropy constrained matrix-weighted VQ, hard-coded to 5-element vectors, for a single input data vector */
*a58d3d2aSXin Livoid silk_VQ_WMat_EC_c(
*a58d3d2aSXin Li    opus_int8                   *ind,                           /* O    index of best codebook vector               */
*a58d3d2aSXin Li    opus_int32                  *res_nrg_Q15,                   /* O    best residual energy                        */
*a58d3d2aSXin Li    opus_int32                  *rate_dist_Q8,                  /* O    best total bitrate                          */
*a58d3d2aSXin Li    opus_int                    *gain_Q7,                       /* O    sum of absolute LTP coefficients            */
*a58d3d2aSXin Li    const opus_int32            *XX_Q17,                        /* I    correlation matrix                          */
*a58d3d2aSXin Li    const opus_int32            *xX_Q17,                        /* I    correlation vector                          */
*a58d3d2aSXin Li    const opus_int8             *cb_Q7,                         /* I    codebook                                    */
*a58d3d2aSXin Li    const opus_uint8            *cb_gain_Q7,                    /* I    codebook effective gain                     */
*a58d3d2aSXin Li    const opus_uint8            *cl_Q5,                         /* I    code length for each codebook vector        */
*a58d3d2aSXin Li    const opus_int              subfr_len,                      /* I    number of samples per subframe              */
*a58d3d2aSXin Li    const opus_int32            max_gain_Q7,                    /* I    maximum sum of absolute LTP coefficients    */
*a58d3d2aSXin Li    const opus_int              L                               /* I    number of vectors in codebook               */
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    opus_int   k, gain_tmp_Q7;
*a58d3d2aSXin Li    const opus_int8 *cb_row_Q7;
*a58d3d2aSXin Li    opus_int32 neg_xX_Q24[ 5 ];
*a58d3d2aSXin Li    opus_int32 sum1_Q15, sum2_Q24;
*a58d3d2aSXin Li    opus_int32 bits_res_Q8, bits_tot_Q8;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Negate and convert to new Q domain */
*a58d3d2aSXin Li    neg_xX_Q24[ 0 ] = -silk_LSHIFT32( xX_Q17[ 0 ], 7 );
*a58d3d2aSXin Li    neg_xX_Q24[ 1 ] = -silk_LSHIFT32( xX_Q17[ 1 ], 7 );
*a58d3d2aSXin Li    neg_xX_Q24[ 2 ] = -silk_LSHIFT32( xX_Q17[ 2 ], 7 );
*a58d3d2aSXin Li    neg_xX_Q24[ 3 ] = -silk_LSHIFT32( xX_Q17[ 3 ], 7 );
*a58d3d2aSXin Li    neg_xX_Q24[ 4 ] = -silk_LSHIFT32( xX_Q17[ 4 ], 7 );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Loop over codebook */
*a58d3d2aSXin Li    *rate_dist_Q8 = silk_int32_MAX;
*a58d3d2aSXin Li    *res_nrg_Q15 = silk_int32_MAX;
*a58d3d2aSXin Li    cb_row_Q7 = cb_Q7;
*a58d3d2aSXin Li    /* If things go really bad, at least *ind is set to something safe. */
*a58d3d2aSXin Li    *ind = 0;
*a58d3d2aSXin Li    for( k = 0; k < L; k++ ) {
*a58d3d2aSXin Li        opus_int32 penalty;
*a58d3d2aSXin Li        gain_tmp_Q7 = cb_gain_Q7[k];
*a58d3d2aSXin Li        /* Weighted rate */
*a58d3d2aSXin Li        /* Quantization error: 1 - 2 * xX * cb + cb' * XX * cb */
*a58d3d2aSXin Li        sum1_Q15 = SILK_FIX_CONST( 1.001, 15 );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Penalty for too large gain */
*a58d3d2aSXin Li        penalty = silk_LSHIFT32( silk_max( silk_SUB32( gain_tmp_Q7, max_gain_Q7 ), 0 ), 11 );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* first row of XX_Q17 */
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( neg_xX_Q24[ 0 ], XX_Q17[  1 ], cb_row_Q7[ 1 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[  2 ], cb_row_Q7[ 2 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[  3 ], cb_row_Q7[ 3 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[  4 ], cb_row_Q7[ 4 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_LSHIFT32( sum2_Q24, 1 );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[  0 ], cb_row_Q7[ 0 ] );
*a58d3d2aSXin Li        sum1_Q15 = silk_SMLAWB( sum1_Q15,        sum2_Q24,  cb_row_Q7[ 0 ] );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* second row of XX_Q17 */
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( neg_xX_Q24[ 1 ], XX_Q17[  7 ], cb_row_Q7[ 2 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[  8 ], cb_row_Q7[ 3 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[  9 ], cb_row_Q7[ 4 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_LSHIFT32( sum2_Q24, 1 );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[  6 ], cb_row_Q7[ 1 ] );
*a58d3d2aSXin Li        sum1_Q15 = silk_SMLAWB( sum1_Q15,        sum2_Q24,  cb_row_Q7[ 1 ] );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* third row of XX_Q17 */
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( neg_xX_Q24[ 2 ], XX_Q17[ 13 ], cb_row_Q7[ 3 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[ 14 ], cb_row_Q7[ 4 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_LSHIFT32( sum2_Q24, 1 );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[ 12 ], cb_row_Q7[ 2 ] );
*a58d3d2aSXin Li        sum1_Q15 = silk_SMLAWB( sum1_Q15,        sum2_Q24,  cb_row_Q7[ 2 ] );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* fourth row of XX_Q17 */
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( neg_xX_Q24[ 3 ], XX_Q17[ 19 ], cb_row_Q7[ 4 ] );
*a58d3d2aSXin Li        sum2_Q24 = silk_LSHIFT32( sum2_Q24, 1 );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[ 18 ], cb_row_Q7[ 3 ] );
*a58d3d2aSXin Li        sum1_Q15 = silk_SMLAWB( sum1_Q15,        sum2_Q24,  cb_row_Q7[ 3 ] );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* last row of XX_Q17 */
*a58d3d2aSXin Li        sum2_Q24 = silk_LSHIFT32( neg_xX_Q24[ 4 ], 1 );
*a58d3d2aSXin Li        sum2_Q24 = silk_MLA( sum2_Q24,        XX_Q17[ 24 ], cb_row_Q7[ 4 ] );
*a58d3d2aSXin Li        sum1_Q15 = silk_SMLAWB( sum1_Q15,        sum2_Q24,  cb_row_Q7[ 4 ] );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* find best */
*a58d3d2aSXin Li        if( sum1_Q15 >= 0 ) {
*a58d3d2aSXin Li            /* Translate residual energy to bits using high-rate assumption (6 dB ==> 1 bit/sample) */
*a58d3d2aSXin Li            bits_res_Q8 = silk_SMULBB( subfr_len, silk_lin2log( sum1_Q15 + penalty) - (15 << 7) );
*a58d3d2aSXin Li            /* In the following line we reduce the codelength component by half ("-1"); seems to slightly improve quality */
*a58d3d2aSXin Li            bits_tot_Q8 = silk_ADD_LSHIFT32( bits_res_Q8, cl_Q5[ k ], 3-1 );
*a58d3d2aSXin Li            if( bits_tot_Q8 <= *rate_dist_Q8 ) {
*a58d3d2aSXin Li                *rate_dist_Q8 = bits_tot_Q8;
*a58d3d2aSXin Li                *res_nrg_Q15 = sum1_Q15 + penalty;
*a58d3d2aSXin Li                *ind = (opus_int8)k;
*a58d3d2aSXin Li                *gain_Q7 = gain_tmp_Q7;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Go to next cbk vector */
*a58d3d2aSXin Li        cb_row_Q7 += LTP_ORDER;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li}