libopus/dnn/burg.c

*a58d3d2aSXin Li/***********************************************************************
*a58d3d2aSXin LiCopyright (c) 2006-2011, Skype Limited. All rights reserved.
*a58d3d2aSXin LiRedistribution and use in source and binary forms, with or without
*a58d3d2aSXin Limodification, are permitted provided that the following conditions
*a58d3d2aSXin Liare met:
*a58d3d2aSXin Li- Redistributions of source code must retain the above copyright notice,
*a58d3d2aSXin Lithis list of conditions and the following disclaimer.
*a58d3d2aSXin Li- Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Linotice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Lidocumentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li- Neither the name of Internet Society, IETF or IETF Trust, nor the
*a58d3d2aSXin Linames of specific contributors, may be used to endorse or promote
*a58d3d2aSXin Liproducts derived from this software without specific prior written
*a58d3d2aSXin Lipermission.
*a58d3d2aSXin LiTHIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
*a58d3d2aSXin LiAND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
*a58d3d2aSXin LiIMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
*a58d3d2aSXin LiARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
*a58d3d2aSXin LiLIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
*a58d3d2aSXin LiCONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
*a58d3d2aSXin LiSUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
*a58d3d2aSXin LiINTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
*a58d3d2aSXin LiCONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
*a58d3d2aSXin LiARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
*a58d3d2aSXin LiPOSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li***********************************************************************/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include <math.h>
*a58d3d2aSXin Li#include <string.h>
*a58d3d2aSXin Li#include <assert.h>
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "arch.h"
*a58d3d2aSXin Li#include "burg.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MAX_FRAME_SIZE              384 /* subfr_length * nb_subfr = ( 0.005 * 16000 + 16 ) * 4 = 384*/
*a58d3d2aSXin Li#define SILK_MAX_ORDER_LPC          16
*a58d3d2aSXin Li#define FIND_LPC_COND_FAC           1e-5f
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* sum of squares of a silk_float array, with result as double */
*a58d3d2aSXin Listatic double silk_energy_FLP(
*a58d3d2aSXin Li    const float    *data,
*a58d3d2aSXin Li    int            dataSize
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    int i;
*a58d3d2aSXin Li    double   result;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* 4x unrolled loop */
*a58d3d2aSXin Li    result = 0.0;
*a58d3d2aSXin Li    for( i = 0; i < dataSize - 3; i += 4 ) {
*a58d3d2aSXin Li        result += data[ i + 0 ] * (double)data[ i + 0 ] +
*a58d3d2aSXin Li                  data[ i + 1 ] * (double)data[ i + 1 ] +
*a58d3d2aSXin Li                  data[ i + 2 ] * (double)data[ i + 2 ] +
*a58d3d2aSXin Li                  data[ i + 3 ] * (double)data[ i + 3 ];
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* add any remaining products */
*a58d3d2aSXin Li    for( ; i < dataSize; i++ ) {
*a58d3d2aSXin Li        result += data[ i ] * (double)data[ i ];
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    assert( result >= 0.0 );
*a58d3d2aSXin Li    return result;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* inner product of two silk_float arrays, with result as double */
*a58d3d2aSXin Listatic double silk_inner_product_FLP(
*a58d3d2aSXin Li    const float    *data1,
*a58d3d2aSXin Li    const float    *data2,
*a58d3d2aSXin Li    int            dataSize
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    int i;
*a58d3d2aSXin Li    double   result;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* 4x unrolled loop */
*a58d3d2aSXin Li    result = 0.0;
*a58d3d2aSXin Li    for( i = 0; i < dataSize - 3; i += 4 ) {
*a58d3d2aSXin Li        result += data1[ i + 0 ] * (double)data2[ i + 0 ] +
*a58d3d2aSXin Li                  data1[ i + 1 ] * (double)data2[ i + 1 ] +
*a58d3d2aSXin Li                  data1[ i + 2 ] * (double)data2[ i + 2 ] +
*a58d3d2aSXin Li                  data1[ i + 3 ] * (double)data2[ i + 3 ];
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* add any remaining products */
*a58d3d2aSXin Li    for( ; i < dataSize; i++ ) {
*a58d3d2aSXin Li        result += data1[ i ] * (double)data2[ i ];
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    return result;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li/* Compute reflection coefficients from input signal */
*a58d3d2aSXin Lifloat silk_burg_analysis(              /* O    returns residual energy                                     */
*a58d3d2aSXin Li    float          A[],                /* O    prediction coefficients (length order)                      */
*a58d3d2aSXin Li    const float    x[],                /* I    input signal, length: nb_subfr*(D+L_sub)                    */
*a58d3d2aSXin Li    const float    minInvGain,         /* I    minimum inverse prediction gain                             */
*a58d3d2aSXin Li    const int      subfr_length,       /* I    input signal subframe length (incl. D preceding samples)    */
*a58d3d2aSXin Li    const int      nb_subfr,           /* I    number of subframes stacked in x                            */
*a58d3d2aSXin Li    const int      D                   /* I    order                                                       */
*a58d3d2aSXin Li)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    int         k, n, s, reached_max_gain;
*a58d3d2aSXin Li    double           C0, invGain, num, nrg_f, nrg_b, rc, Atmp, tmp1, tmp2;
*a58d3d2aSXin Li    const float *x_ptr;
*a58d3d2aSXin Li    double           C_first_row[ SILK_MAX_ORDER_LPC ], C_last_row[ SILK_MAX_ORDER_LPC ];
*a58d3d2aSXin Li    double           CAf[ SILK_MAX_ORDER_LPC + 1 ], CAb[ SILK_MAX_ORDER_LPC + 1 ];
*a58d3d2aSXin Li    double           Af[ SILK_MAX_ORDER_LPC ];
*a58d3d2aSXin Li
*a58d3d2aSXin Li    assert( subfr_length * nb_subfr <= MAX_FRAME_SIZE );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Compute autocorrelations, added over subframes */
*a58d3d2aSXin Li    C0 = silk_energy_FLP( x, nb_subfr * subfr_length );
*a58d3d2aSXin Li    memset( C_first_row, 0, SILK_MAX_ORDER_LPC * sizeof( double ) );
*a58d3d2aSXin Li    for( s = 0; s < nb_subfr; s++ ) {
*a58d3d2aSXin Li        x_ptr = x + s * subfr_length;
*a58d3d2aSXin Li        for( n = 1; n < D + 1; n++ ) {
*a58d3d2aSXin Li            C_first_row[ n - 1 ] += silk_inner_product_FLP( x_ptr, x_ptr + n, subfr_length - n );
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    memcpy( C_last_row, C_first_row, SILK_MAX_ORDER_LPC * sizeof( double ) );
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Initialize */
*a58d3d2aSXin Li    CAb[ 0 ] = CAf[ 0 ] = C0 + FIND_LPC_COND_FAC * C0 + 1e-9f;
*a58d3d2aSXin Li    invGain = 1.0f;
*a58d3d2aSXin Li    reached_max_gain = 0;
*a58d3d2aSXin Li    for( n = 0; n < D; n++ ) {
*a58d3d2aSXin Li        /* Update first row of correlation matrix (without first element) */
*a58d3d2aSXin Li        /* Update last row of correlation matrix (without last element, stored in reversed order) */
*a58d3d2aSXin Li        /* Update C * Af */
*a58d3d2aSXin Li        /* Update C * flipud(Af) (stored in reversed order) */
*a58d3d2aSXin Li        for( s = 0; s < nb_subfr; s++ ) {
*a58d3d2aSXin Li            x_ptr = x + s * subfr_length;
*a58d3d2aSXin Li            tmp1 = x_ptr[ n ];
*a58d3d2aSXin Li            tmp2 = x_ptr[ subfr_length - n - 1 ];
*a58d3d2aSXin Li            for( k = 0; k < n; k++ ) {
*a58d3d2aSXin Li                C_first_row[ k ] -= x_ptr[ n ] * x_ptr[ n - k - 1 ];
*a58d3d2aSXin Li                C_last_row[ k ]  -= x_ptr[ subfr_length - n - 1 ] * x_ptr[ subfr_length - n + k ];
*a58d3d2aSXin Li                Atmp = Af[ k ];
*a58d3d2aSXin Li                tmp1 += x_ptr[ n - k - 1 ] * Atmp;
*a58d3d2aSXin Li                tmp2 += x_ptr[ subfr_length - n + k ] * Atmp;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li            for( k = 0; k <= n; k++ ) {
*a58d3d2aSXin Li                CAf[ k ] -= tmp1 * x_ptr[ n - k ];
*a58d3d2aSXin Li                CAb[ k ] -= tmp2 * x_ptr[ subfr_length - n + k - 1 ];
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        tmp1 = C_first_row[ n ];
*a58d3d2aSXin Li        tmp2 = C_last_row[ n ];
*a58d3d2aSXin Li        for( k = 0; k < n; k++ ) {
*a58d3d2aSXin Li            Atmp = Af[ k ];
*a58d3d2aSXin Li            tmp1 += C_last_row[  n - k - 1 ] * Atmp;
*a58d3d2aSXin Li            tmp2 += C_first_row[ n - k - 1 ] * Atmp;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        CAf[ n + 1 ] = tmp1;
*a58d3d2aSXin Li        CAb[ n + 1 ] = tmp2;
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Calculate nominator and denominator for the next order reflection (parcor) coefficient */
*a58d3d2aSXin Li        num = CAb[ n + 1 ];
*a58d3d2aSXin Li        nrg_b = CAb[ 0 ];
*a58d3d2aSXin Li        nrg_f = CAf[ 0 ];
*a58d3d2aSXin Li        for( k = 0; k < n; k++ ) {
*a58d3d2aSXin Li            Atmp = Af[ k ];
*a58d3d2aSXin Li            num   += CAb[ n - k ] * Atmp;
*a58d3d2aSXin Li            nrg_b += CAb[ k + 1 ] * Atmp;
*a58d3d2aSXin Li            nrg_f += CAf[ k + 1 ] * Atmp;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        assert( nrg_f > 0.0 );
*a58d3d2aSXin Li        assert( nrg_b > 0.0 );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Calculate the next order reflection (parcor) coefficient */
*a58d3d2aSXin Li        rc = -2.0 * num / ( nrg_f + nrg_b );
*a58d3d2aSXin Li        assert( rc > -1.0 && rc < 1.0 );
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Update inverse prediction gain */
*a58d3d2aSXin Li        tmp1 = invGain * ( 1.0 - rc * rc );
*a58d3d2aSXin Li        if( tmp1 <= minInvGain ) {
*a58d3d2aSXin Li            /* Max prediction gain exceeded; set reflection coefficient such that max prediction gain is exactly hit */
*a58d3d2aSXin Li            rc = sqrt( 1.0 - minInvGain / invGain );
*a58d3d2aSXin Li            if( num > 0 ) {
*a58d3d2aSXin Li                /* Ensure adjusted reflection coefficients has the original sign */
*a58d3d2aSXin Li                rc = -rc;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li            invGain = minInvGain;
*a58d3d2aSXin Li            reached_max_gain = 1;
*a58d3d2aSXin Li        } else {
*a58d3d2aSXin Li            invGain = tmp1;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Update the AR coefficients */
*a58d3d2aSXin Li        for( k = 0; k < (n + 1) >> 1; k++ ) {
*a58d3d2aSXin Li            tmp1 = Af[ k ];
*a58d3d2aSXin Li            tmp2 = Af[ n - k - 1 ];
*a58d3d2aSXin Li            Af[ k ]         = tmp1 + rc * tmp2;
*a58d3d2aSXin Li            Af[ n - k - 1 ] = tmp2 + rc * tmp1;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        Af[ n ] = rc;
*a58d3d2aSXin Li
*a58d3d2aSXin Li        if( reached_max_gain ) {
*a58d3d2aSXin Li            /* Reached max prediction gain; set remaining coefficients to zero and exit loop */
*a58d3d2aSXin Li            for( k = n + 1; k < D; k++ ) {
*a58d3d2aSXin Li                Af[ k ] = 0.0;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li            break;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li
*a58d3d2aSXin Li        /* Update C * Af and C * Ab */
*a58d3d2aSXin Li        for( k = 0; k <= n + 1; k++ ) {
*a58d3d2aSXin Li            tmp1 = CAf[ k ];
*a58d3d2aSXin Li            CAf[ k ]          += rc * CAb[ n - k + 1 ];
*a58d3d2aSXin Li            CAb[ n - k + 1  ] += rc * tmp1;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    if( reached_max_gain ) {
*a58d3d2aSXin Li        /* Convert to float */
*a58d3d2aSXin Li        for( k = 0; k < D; k++ ) {
*a58d3d2aSXin Li            A[ k ] = (float)( -Af[ k ] );
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        /* Subtract energy of preceding samples from C0 */
*a58d3d2aSXin Li        for( s = 0; s < nb_subfr; s++ ) {
*a58d3d2aSXin Li            C0 -= silk_energy_FLP( x + s * subfr_length, D );
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        /* Approximate residual energy */
*a58d3d2aSXin Li        nrg_f = C0 * invGain;
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li        /* Compute residual energy and store coefficients as float */
*a58d3d2aSXin Li        nrg_f = CAf[ 0 ];
*a58d3d2aSXin Li        tmp1 = 1.0;
*a58d3d2aSXin Li        for( k = 0; k < D; k++ ) {
*a58d3d2aSXin Li            Atmp = Af[ k ];
*a58d3d2aSXin Li            nrg_f += CAf[ k + 1 ] * Atmp;
*a58d3d2aSXin Li            tmp1  += Atmp * Atmp;
*a58d3d2aSXin Li            A[ k ] = (float)(-Atmp);
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        nrg_f -= FIND_LPC_COND_FAC * C0 * tmp1;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* Return residual energy */
*a58d3d2aSXin Li    return MAX32(0, (float)nrg_f);
*a58d3d2aSXin Li}