libmpeg2/decoder/impeg2d_vld.c

*a97c2a1fSXin Li/******************************************************************************
*a97c2a1fSXin Li *
*a97c2a1fSXin Li * Copyright (C) 2015 The Android Open Source Project
*a97c2a1fSXin Li *
*a97c2a1fSXin Li * Licensed under the Apache License, Version 2.0 (the "License");
*a97c2a1fSXin Li * you may not use this file except in compliance with the License.
*a97c2a1fSXin Li * You may obtain a copy of the License at:
*a97c2a1fSXin Li *
*a97c2a1fSXin Li * http://www.apache.org/licenses/LICENSE-2.0
*a97c2a1fSXin Li *
*a97c2a1fSXin Li * Unless required by applicable law or agreed to in writing, software
*a97c2a1fSXin Li * distributed under the License is distributed on an "AS IS" BASIS,
*a97c2a1fSXin Li * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
*a97c2a1fSXin Li * See the License for the specific language governing permissions and
*a97c2a1fSXin Li * limitations under the License.
*a97c2a1fSXin Li *
*a97c2a1fSXin Li *****************************************************************************
*a97c2a1fSXin Li * Originally developed and contributed by Ittiam Systems Pvt. Ltd, Bangalore
*a97c2a1fSXin Li*/
*a97c2a1fSXin Li#include <string.h>
*a97c2a1fSXin Li
*a97c2a1fSXin Li#include "iv_datatypedef.h"
*a97c2a1fSXin Li#include "iv.h"
*a97c2a1fSXin Li
*a97c2a1fSXin Li#include "impeg2_buf_mgr.h"
*a97c2a1fSXin Li#include "impeg2_disp_mgr.h"
*a97c2a1fSXin Li#include "impeg2_defs.h"
*a97c2a1fSXin Li#include "impeg2_platform_macros.h"
*a97c2a1fSXin Li#include "impeg2_inter_pred.h"
*a97c2a1fSXin Li#include "impeg2_idct.h"
*a97c2a1fSXin Li#include "impeg2_globals.h"
*a97c2a1fSXin Li#include "impeg2_mem_func.h"
*a97c2a1fSXin Li#include "impeg2_format_conv.h"
*a97c2a1fSXin Li#include "impeg2_macros.h"
*a97c2a1fSXin Li
*a97c2a1fSXin Li#include "ivd.h"
*a97c2a1fSXin Li#include "impeg2d.h"
*a97c2a1fSXin Li#include "impeg2d_bitstream.h"
*a97c2a1fSXin Li#include "impeg2d_structs.h"
*a97c2a1fSXin Li#include "impeg2d_vld_tables.h"
*a97c2a1fSXin Li#include "impeg2d_vld.h"
*a97c2a1fSXin Li#include "impeg2d_pic_proc.h"
*a97c2a1fSXin Li#include "impeg2d_debug.h"
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li/*******************************************************************************
*a97c2a1fSXin Li* Function name : impeg2d_dec_vld_symbol
*a97c2a1fSXin Li*
*a97c2a1fSXin Li* Description   : Performs decoding of VLD symbol. It performs decoding by
*a97c2a1fSXin Li*                 processing 1 bit at a time
*a97c2a1fSXin Li*
*a97c2a1fSXin Li* Arguments     :
*a97c2a1fSXin Li* stream        : Bitstream
*a97c2a1fSXin Li* ai2_code_table     : Table used for decoding
*a97c2a1fSXin Li* maxLen        : Maximum Length of the decoded symbol in bits
*a97c2a1fSXin Li*
*a97c2a1fSXin Li* Value Returned: Decoded symbol
*a97c2a1fSXin Li*******************************************************************************/
*a97c2a1fSXin LiWORD16 impeg2d_dec_vld_symbol(stream_t *ps_stream,const WORD16 ai2_code_table[][2],  UWORD16 u2_max_len)
*a97c2a1fSXin Li{
*a97c2a1fSXin Li  UWORD16 u2_data;
*a97c2a1fSXin Li  WORD16  u2_end = 0;
*a97c2a1fSXin Li  UWORD16 u2_org_max_len = u2_max_len;
*a97c2a1fSXin Li  UWORD16 u2_i_bit;
*a97c2a1fSXin Li
*a97c2a1fSXin Li  /* Get the maximum number of bits needed to decode a symbol */
*a97c2a1fSXin Li  u2_data = impeg2d_bit_stream_nxt(ps_stream,u2_max_len);
*a97c2a1fSXin Li  do
*a97c2a1fSXin Li  {
*a97c2a1fSXin Li    u2_max_len--;
*a97c2a1fSXin Li    /* Read one bit at a time from the variable to decode the huffman code */
*a97c2a1fSXin Li    u2_i_bit = (UWORD8)((u2_data >> u2_max_len) & 0x1);
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /* Get the next node pointer or the symbol from the tree */
*a97c2a1fSXin Li    u2_end = ai2_code_table[u2_end][u2_i_bit];
*a97c2a1fSXin Li  }while(u2_end > 0);
*a97c2a1fSXin Li
*a97c2a1fSXin Li  /* Flush the appropriate number of bits from the ps_stream */
*a97c2a1fSXin Li  impeg2d_bit_stream_flush(ps_stream,(UWORD8)(u2_org_max_len - u2_max_len));
*a97c2a1fSXin Li  return(u2_end);
*a97c2a1fSXin Li}
*a97c2a1fSXin Li/*******************************************************************************
*a97c2a1fSXin Li* Function name : impeg2d_fast_dec_vld_symbol
*a97c2a1fSXin Li*
*a97c2a1fSXin Li* Description   : Performs decoding of VLD symbol. It performs decoding by
*a97c2a1fSXin Li*                 processing n bits at a time
*a97c2a1fSXin Li*
*a97c2a1fSXin Li* Arguments     :
*a97c2a1fSXin Li* stream        : Bitstream
*a97c2a1fSXin Li* ai2_code_table     : Code table containing huffman value
*a97c2a1fSXin Li* indexTable    : Index table containing index
*a97c2a1fSXin Li* maxLen        : Maximum Length of the decoded symbol in bits
*a97c2a1fSXin Li*
*a97c2a1fSXin Li* Value Returned: Decoded symbol
*a97c2a1fSXin Li*******************************************************************************/
*a97c2a1fSXin LiWORD16 impeg2d_fast_dec_vld_symbol(stream_t *ps_stream,
*a97c2a1fSXin Li                     const WORD16  ai2_code_table[][2],
*a97c2a1fSXin Li                     const UWORD16 au2_indexTable[][2],
*a97c2a1fSXin Li                     UWORD16 u2_max_len)
*a97c2a1fSXin Li{
*a97c2a1fSXin Li    UWORD16 u2_cur_code;
*a97c2a1fSXin Li    UWORD16 u2_num_bits;
*a97c2a1fSXin Li    UWORD16 u2_vld_offset;
*a97c2a1fSXin Li    UWORD16 u2_start_len;
*a97c2a1fSXin Li    WORD16  u2_value;
*a97c2a1fSXin Li    UWORD16 u2_len;
*a97c2a1fSXin Li    UWORD16 u2_huffCode;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    u2_start_len  = au2_indexTable[0][0];
*a97c2a1fSXin Li    u2_vld_offset = 0;
*a97c2a1fSXin Li    u2_huffCode  = impeg2d_bit_stream_nxt(ps_stream,u2_max_len);
*a97c2a1fSXin Li    do
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        u2_cur_code = u2_huffCode >> (u2_max_len - u2_start_len);
*a97c2a1fSXin Li        u2_num_bits = ai2_code_table[u2_cur_code + u2_vld_offset][0];
*a97c2a1fSXin Li        if(u2_num_bits == 0)
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            u2_huffCode  &= ((1 << (u2_max_len - u2_start_len)) - 1);
*a97c2a1fSXin Li            u2_max_len    -= u2_start_len;
*a97c2a1fSXin Li            u2_start_len   = au2_indexTable[ai2_code_table[u2_cur_code + u2_vld_offset][1]][0];
*a97c2a1fSXin Li            u2_vld_offset  = au2_indexTable[ai2_code_table[u2_cur_code + u2_vld_offset][1]][1];
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li        else
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            u2_value = ai2_code_table[u2_cur_code + u2_vld_offset][1];
*a97c2a1fSXin Li            u2_len   = u2_num_bits;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li    }while(u2_num_bits == 0);
*a97c2a1fSXin Li    impeg2d_bit_stream_flush(ps_stream,u2_len);
*a97c2a1fSXin Li    return(u2_value);
*a97c2a1fSXin Li}
*a97c2a1fSXin Li/******************************************************************************
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Function Name   : impeg2d_dec_ac_coeff_zero
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Description     : Decodes using Table B.14
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Arguments       : Pointer to VideoObjectLayerStructure
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Values Returned : Decoded value
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Revision History:
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*         28 02 2002  AR        Creation
*a97c2a1fSXin Li*******************************************************************************/
*a97c2a1fSXin LiUWORD16 impeg2d_dec_ac_coeff_zero(stream_t *ps_stream, UWORD16* pu2_sym_len, UWORD16* pu2_sym_val)
*a97c2a1fSXin Li{
*a97c2a1fSXin Li    UWORD16 u2_offset,u2_decoded_value;
*a97c2a1fSXin Li    UWORD8  u1_shift;
*a97c2a1fSXin Li    UWORD32 u4_bits_read;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    u4_bits_read = (UWORD16)impeg2d_bit_stream_nxt(ps_stream,MPEG2_AC_COEFF_MAX_LEN);
*a97c2a1fSXin Li
*a97c2a1fSXin Li    if ((UWORD16)u4_bits_read >= 0x0800)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        u2_offset = (UWORD16)u4_bits_read >> 11;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else if ((UWORD16)u4_bits_read >= 0x40)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        u2_offset = 31 + ((UWORD16)u4_bits_read >> 6);
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else if ((UWORD16)u4_bits_read >= 0x20)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        u2_offset = 64;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        u2_offset      = 63;
*a97c2a1fSXin Li        u4_bits_read    = (UWORD16)u4_bits_read - 0x10;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    /*-----------------------------------------------------------------------
*a97c2a1fSXin Li     * The table gOffset contains both the offset for the group to which the
*a97c2a1fSXin Li     * Vld code belongs in the Ac Coeff Table and the no of bits with which
*a97c2a1fSXin Li     * the BitsRead should be shifted
*a97c2a1fSXin Li     *-----------------------------------------------------------------------*/
*a97c2a1fSXin Li    u2_offset = gau2_impeg2d_offset_zero[u2_offset];
*a97c2a1fSXin Li    u1_shift  = u2_offset & 0xF;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /*-----------------------------------------------------------------------
*a97c2a1fSXin Li     * Depending upon the vld code, we index exactly to that particular
*a97c2a1fSXin Li     * Vld codes value in the Ac Coeff Table.
*a97c2a1fSXin Li     * (Offset >> 4)       gives the offset for the group in the AcCoeffTable.
*a97c2a1fSXin Li     * (BitsRead >> shift) gives the offset within its group
*a97c2a1fSXin Li     *-----------------------------------------------------------------------*/
*a97c2a1fSXin Li     u2_offset = (u2_offset >> 4) + ((UWORD16)u4_bits_read >> u1_shift);
*a97c2a1fSXin Li    /*-----------------------------------------------------------------------
*a97c2a1fSXin Li     * DecodedValue has the Run, Level and the number of bits used by Vld code
*a97c2a1fSXin Li     *-----------------------------------------------------------------------*/
*a97c2a1fSXin Li    u2_decoded_value = gau2_impeg2d_dct_coeff_zero[u2_offset];
*a97c2a1fSXin Li    if(u2_decoded_value == END_OF_BLOCK)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        *pu2_sym_len = 2;
*a97c2a1fSXin Li        *pu2_sym_val = EOB_CODE_VALUE;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else if(u2_decoded_value == ESCAPE_CODE)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        *pu2_sym_len     = u2_decoded_value & 0x1F;
*a97c2a1fSXin Li        *pu2_sym_val = ESC_CODE_VALUE;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        *pu2_sym_len = u2_decoded_value & 0x1F;
*a97c2a1fSXin Li        *pu2_sym_val = u2_decoded_value >> 5;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    return(u2_decoded_value);
*a97c2a1fSXin Li}
*a97c2a1fSXin Li
*a97c2a1fSXin Li/******************************************************************************
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Function Name   : impeg2d_dec_ac_coeff_one
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Description     : Decodes using Table B.15
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Arguments       : Pointer to VideoObjectLayerStructure
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Values Returned : Decoded value
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Revision History:
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*         28 02 2002  AR        Creation
*a97c2a1fSXin Li*******************************************************************************/
*a97c2a1fSXin LiUWORD16 impeg2d_dec_ac_coeff_one(stream_t *ps_stream, UWORD16* pu2_sym_len, UWORD16* pu2_sym_val)
*a97c2a1fSXin Li{
*a97c2a1fSXin Li    UWORD16 u2_offset, u2_decoded_value;
*a97c2a1fSXin Li    UWORD8  u1_shift;
*a97c2a1fSXin Li    UWORD32 u4_bits_read;
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li    u4_bits_read = (UWORD16)impeg2d_bit_stream_nxt(ps_stream,MPEG2_AC_COEFF_MAX_LEN);
*a97c2a1fSXin Li
*a97c2a1fSXin Li    if ((UWORD16)u4_bits_read >= 0x8000)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        /* If the MSB of the vld code is 1 */
*a97c2a1fSXin Li        if (((UWORD16)u4_bits_read >> 12) == 0xF)
*a97c2a1fSXin Li            u2_offset = ((UWORD16)u4_bits_read >> 8) & 0xF;
*a97c2a1fSXin Li        else
*a97c2a1fSXin Li            u2_offset = (UWORD16)u4_bits_read >> 11;
*a97c2a1fSXin Li        u2_offset += gau2_impeg2d_offset_one[0];
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else if ((UWORD16)u4_bits_read >= 0x400)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        u2_offset =(UWORD16) u4_bits_read >> 10;
*a97c2a1fSXin Li        u2_offset = gau2_impeg2d_offset_one[u2_offset];
*a97c2a1fSXin Li        u1_shift = u2_offset & 0xF;
*a97c2a1fSXin Li        u2_offset = (u2_offset >> 4) + ((UWORD16)u4_bits_read >> u1_shift);
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else if ((UWORD16)u4_bits_read >= 0x20)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        u2_offset = ((UWORD16)u4_bits_read >> 5) + 31;
*a97c2a1fSXin Li        u2_offset = gau2_impeg2d_offset_one[u2_offset];
*a97c2a1fSXin Li        u1_shift = u2_offset & 0xF;
*a97c2a1fSXin Li        u2_offset = (u2_offset >> 4) + ((UWORD16)u4_bits_read >> u1_shift);
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        u2_offset = gau2_impeg2d_offset_one[63] + ((UWORD16)u4_bits_read & 0xF);
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    /*-----------------------------------------------------------------------
*a97c2a1fSXin Li    * DecodedValue has the Run, Level and the number of bits used by Vld code
*a97c2a1fSXin Li    *-----------------------------------------------------------------------*/
*a97c2a1fSXin Li    u2_decoded_value = gau2_impeg2d_dct_coeff_one[u2_offset];
*a97c2a1fSXin Li
*a97c2a1fSXin Li    if(u2_decoded_value == END_OF_BLOCK)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        *pu2_sym_len = 4;
*a97c2a1fSXin Li        *pu2_sym_val = EOB_CODE_VALUE;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else if(u2_decoded_value == ESCAPE_CODE)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        *pu2_sym_len     = u2_decoded_value & 0x1F;
*a97c2a1fSXin Li        *pu2_sym_val = ESC_CODE_VALUE;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    else
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        *pu2_sym_len = u2_decoded_value & 0x1F;
*a97c2a1fSXin Li        *pu2_sym_val = u2_decoded_value >> 5;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li    return(u2_decoded_value);
*a97c2a1fSXin Li}
*a97c2a1fSXin Li
*a97c2a1fSXin Li/******************************************************************************
*a97c2a1fSXin Li *
*a97c2a1fSXin Li *  Function Name   : impeg2d_vld_inv_quant_mpeg1
*a97c2a1fSXin Li *
*a97c2a1fSXin Li *  Description     : Performs VLD operation for MPEG1/2
*a97c2a1fSXin Li *
*a97c2a1fSXin Li *  Arguments       :
*a97c2a1fSXin Li *  state           : VLCD state parameter
*a97c2a1fSXin Li *  regs            : Registers of VLCD
*a97c2a1fSXin Li *
*a97c2a1fSXin Li *  Values Returned : None
*a97c2a1fSXin Li ******************************************************************************/
*a97c2a1fSXin LiIMPEG2D_ERROR_CODES_T impeg2d_vld_inv_quant_mpeg1(
*a97c2a1fSXin Li                             void  *pv_dec,           /* Decoder State */
*a97c2a1fSXin Li                             WORD16       *pi2_out_addr,       /*!< Address where decoded symbols will be stored */
*a97c2a1fSXin Li                             const UWORD8 *pu1_scan,          /*!< Scan table to be used */
*a97c2a1fSXin Li                             UWORD16      u2_intra_flag,      /*!< Intra Macroblock or not */
*a97c2a1fSXin Li                             UWORD16      u2_colr_comp,      /*!< 0 - Luma,1 - U comp, 2 - V comp */
*a97c2a1fSXin Li                             UWORD16      u2_d_picture        /*!< D Picture or not */
*a97c2a1fSXin Li                             )
*a97c2a1fSXin Li{
*a97c2a1fSXin Li    UWORD8  *pu1_weighting_matrix;
*a97c2a1fSXin Li    dec_state_t *ps_dec    = (dec_state_t *) pv_dec;
*a97c2a1fSXin Li    IMPEG2D_ERROR_CODES_T e_error   = (IMPEG2D_ERROR_CODES_T)IVD_ERROR_NONE;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    WORD16  pi2_coeffs[NUM_COEFFS];
*a97c2a1fSXin Li    UWORD8  pu1_pos[NUM_COEFFS];
*a97c2a1fSXin Li    WORD32  i4_num_coeffs;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /* Perform VLD on the stream to get the coefficients and their positions */
*a97c2a1fSXin Li    e_error = impeg2d_vld_decode(ps_dec, pi2_coeffs, pu1_scan, pu1_pos, u2_intra_flag,
*a97c2a1fSXin Li                                 u2_colr_comp, u2_d_picture, ps_dec->u2_intra_vlc_format,
*a97c2a1fSXin Li                                 ps_dec->u2_is_mpeg2, &i4_num_coeffs);
*a97c2a1fSXin Li    if ((IMPEG2D_ERROR_CODES_T)IVD_ERROR_NONE != e_error)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        return e_error;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /* For YUV420 format,Select the weighting matrix according to Table 7.5 */
*a97c2a1fSXin Li    pu1_weighting_matrix = (u2_intra_flag == 1) ? ps_dec->au1_intra_quant_matrix:
*a97c2a1fSXin Li                    ps_dec->au1_inter_quant_matrix;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    IMPEG2D_IQNT_INP_STATISTICS(pi2_out_addr, ps_dec->u4_non_zero_cols, ps_dec->u4_non_zero_rows);
*a97c2a1fSXin Li    /* Inverse Quantize the Output of VLD */
*a97c2a1fSXin Li    PROFILE_DISABLE_INVQUANT_IF0
*a97c2a1fSXin Li
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        /* Clear output matrix */
*a97c2a1fSXin Li        PROFILE_DISABLE_MEMSET_RESBUF_IF0
*a97c2a1fSXin Li        if (1 != (ps_dec->u4_non_zero_cols | ps_dec->u4_non_zero_rows))
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            ps_dec->pf_memset_16bit_8x8_linear_block (pi2_out_addr);
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li        impeg2d_inv_quant_mpeg1(pi2_out_addr, pu1_weighting_matrix,
*a97c2a1fSXin Li                                  ps_dec->u1_quant_scale, u2_intra_flag,
*a97c2a1fSXin Li                                  i4_num_coeffs, pi2_coeffs, pu1_pos,
*a97c2a1fSXin Li                                  pu1_scan, &ps_dec->u2_def_dc_pred[u2_colr_comp],
*a97c2a1fSXin Li                                  ps_dec->u2_intra_dc_precision);
*a97c2a1fSXin Li
*a97c2a1fSXin Li        if (0 != pi2_out_addr[0])
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            /* The first coeff might've become non-zero due to intra_dc_decision
*a97c2a1fSXin Li             * value. So, check here after inverse quantization.
*a97c2a1fSXin Li             */
*a97c2a1fSXin Li            ps_dec->u4_non_zero_cols  |= 0x1;
*a97c2a1fSXin Li            ps_dec->u4_non_zero_rows  |= 0x1;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li    return e_error;
*a97c2a1fSXin Li}
*a97c2a1fSXin Li
*a97c2a1fSXin Li/******************************************************************************
*a97c2a1fSXin Li  *
*a97c2a1fSXin Li  *  Function Name   : impeg2d_vld_inv_quant_mpeg2
*a97c2a1fSXin Li  *
*a97c2a1fSXin Li  *  Description     : Performs VLD operation for MPEG1/2
*a97c2a1fSXin Li  *
*a97c2a1fSXin Li  *  Arguments       :
*a97c2a1fSXin Li  *  state           : VLCD state parameter
*a97c2a1fSXin Li  *  regs            : Registers of VLCD
*a97c2a1fSXin Li  *
*a97c2a1fSXin Li  *  Values Returned : None
*a97c2a1fSXin Li  ******************************************************************************/
*a97c2a1fSXin LiIMPEG2D_ERROR_CODES_T impeg2d_vld_inv_quant_mpeg2(
*a97c2a1fSXin Li                             void  *pv_dec,           /* Decoder State */
*a97c2a1fSXin Li                             WORD16       *pi2_out_addr,       /*!< Address where decoded symbols will be stored */
*a97c2a1fSXin Li                             const UWORD8 *pu1_scan,          /*!< Scan table to be used */
*a97c2a1fSXin Li                             UWORD16      u2_intra_flag,      /*!< Intra Macroblock or not */
*a97c2a1fSXin Li                             UWORD16      u2_colr_comp,      /*!< 0 - Luma,1 - U comp, 2 - V comp */
*a97c2a1fSXin Li                             UWORD16      u2_d_picture        /*!< D Picture or not */
*a97c2a1fSXin Li                             )
*a97c2a1fSXin Li{
*a97c2a1fSXin Li    UWORD8  *pu1_weighting_matrix;
*a97c2a1fSXin Li    WORD32 i4_sum;
*a97c2a1fSXin Li    dec_state_t *ps_dec = (dec_state_t *)pv_dec;
*a97c2a1fSXin Li    IMPEG2D_ERROR_CODES_T e_error = (IMPEG2D_ERROR_CODES_T)IVD_ERROR_NONE;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    WORD16  pi2_coeffs[NUM_COEFFS];
*a97c2a1fSXin Li    UWORD8  pi4_pos[NUM_COEFFS];
*a97c2a1fSXin Li    WORD32  i4_num_coeffs;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /* Perform VLD on the stream to get the coefficients and their positions */
*a97c2a1fSXin Li    e_error = impeg2d_vld_decode(ps_dec, pi2_coeffs, pu1_scan, pi4_pos, u2_intra_flag,
*a97c2a1fSXin Li                                 u2_colr_comp, u2_d_picture, ps_dec->u2_intra_vlc_format,
*a97c2a1fSXin Li                                 ps_dec->u2_is_mpeg2, &i4_num_coeffs);
*a97c2a1fSXin Li    if ((IMPEG2D_ERROR_CODES_T)IVD_ERROR_NONE != e_error)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        return e_error;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /* For YUV420 format,Select the weighting matrix according to Table 7.5 */
*a97c2a1fSXin Li    pu1_weighting_matrix = (u2_intra_flag == 1) ? ps_dec->au1_intra_quant_matrix:
*a97c2a1fSXin Li                    ps_dec->au1_inter_quant_matrix;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /*mismatch control for mpeg2*/
*a97c2a1fSXin Li    /* Check if the block has only one non-zero coeff which is DC  */
*a97c2a1fSXin Li    ps_dec->i4_last_value_one = 0;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    IMPEG2D_IQNT_INP_STATISTICS(pi2_out_addr, ps_dec->u4_non_zero_cols, ps_dec->u4_non_zero_rows);
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /* Inverse Quantize the Output of VLD */
*a97c2a1fSXin Li    PROFILE_DISABLE_INVQUANT_IF0
*a97c2a1fSXin Li
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        /* Clear output matrix */
*a97c2a1fSXin Li        PROFILE_DISABLE_MEMSET_RESBUF_IF0
*a97c2a1fSXin Li        if (1 != (ps_dec->u4_non_zero_cols | ps_dec->u4_non_zero_rows))
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            ps_dec->pf_memset_16bit_8x8_linear_block (pi2_out_addr);
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li        i4_sum  = impeg2d_inv_quant_mpeg2(pi2_out_addr, pu1_weighting_matrix,
*a97c2a1fSXin Li                                                 ps_dec->u1_quant_scale, u2_intra_flag,
*a97c2a1fSXin Li                                                 i4_num_coeffs, pi2_coeffs,
*a97c2a1fSXin Li                                                 pi4_pos, pu1_scan,
*a97c2a1fSXin Li                                                 &ps_dec->u2_def_dc_pred[u2_colr_comp],
*a97c2a1fSXin Li                                                 ps_dec->u2_intra_dc_precision);
*a97c2a1fSXin Li
*a97c2a1fSXin Li        if (0 != pi2_out_addr[0])
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            /* The first coeff might've become non-zero due to intra_dc_decision
*a97c2a1fSXin Li             * value. So, check here after inverse quantization.
*a97c2a1fSXin Li             */
*a97c2a1fSXin Li            ps_dec->u4_non_zero_cols  |= 0x1;
*a97c2a1fSXin Li            ps_dec->u4_non_zero_rows  |= 0x1;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li        if (1 == (ps_dec->u4_non_zero_cols | ps_dec->u4_non_zero_rows))
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            ps_dec->i4_last_value_one = 1 - (pi2_out_addr[0] & 1);
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li        else
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            /*toggle last bit if sum is even ,else retain it as it is*/
*a97c2a1fSXin Li            pi2_out_addr[63]        ^= (i4_sum & 1);
*a97c2a1fSXin Li
*a97c2a1fSXin Li            if (0 != pi2_out_addr[63])
*a97c2a1fSXin Li            {
*a97c2a1fSXin Li                ps_dec->u4_non_zero_cols  |= 0x80;
*a97c2a1fSXin Li                ps_dec->u4_non_zero_rows  |= 0x80;
*a97c2a1fSXin Li            }
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li    return e_error;
*a97c2a1fSXin Li}
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li/******************************************************************************
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Function Name   : impeg2d_vld_decode
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Description     : Performs VLD operation for MPEG1/2
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Arguments       :
*a97c2a1fSXin Li*  state           : VLCD state parameter
*a97c2a1fSXin Li*  regs            : Registers of VLCD
*a97c2a1fSXin Li*
*a97c2a1fSXin Li*  Values Returned : None
*a97c2a1fSXin Li******************************************************************************/
*a97c2a1fSXin LiIMPEG2D_ERROR_CODES_T impeg2d_vld_decode(
*a97c2a1fSXin Li    dec_state_t *ps_dec,
*a97c2a1fSXin Li    WORD16      *pi2_outAddr,       /*!< Address where decoded symbols will be stored */
*a97c2a1fSXin Li    const UWORD8 *pu1_scan,         /*!< Scan table to be used */
*a97c2a1fSXin Li    UWORD8      *pu1_pos,       /*!< Scan table to be used */
*a97c2a1fSXin Li    UWORD16     u2_intra_flag,      /*!< Intra Macroblock or not */
*a97c2a1fSXin Li    UWORD16     u2_chroma_flag,     /*!< Chroma Block or not */
*a97c2a1fSXin Li    UWORD16     u2_d_picture,       /*!< D Picture or not */
*a97c2a1fSXin Li    UWORD16     u2_intra_vlc_format, /*!< Intra VLC format */
*a97c2a1fSXin Li    UWORD16     u2_mpeg2,          /*!< MPEG-2 or not */
*a97c2a1fSXin Li    WORD32      *pi4_num_coeffs /*!< Returns the number of coeffs in block */
*a97c2a1fSXin Li    )
*a97c2a1fSXin Li{
*a97c2a1fSXin Li
*a97c2a1fSXin Li    UWORD32 u4_sym_len;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    UWORD32 u4_decoded_value;
*a97c2a1fSXin Li    WORD32 i4_level_first_byte;
*a97c2a1fSXin Li    WORD32  i4_level;
*a97c2a1fSXin Li    UWORD32 u4_run, u4_numCoeffs;
*a97c2a1fSXin Li    UWORD32 u4_buf;
*a97c2a1fSXin Li    UWORD32 u4_buf_nxt;
*a97c2a1fSXin Li    UWORD32 u4_offset;
*a97c2a1fSXin Li    UWORD32 *pu4_buf_aligned;
*a97c2a1fSXin Li    UWORD32 u4_bits;
*a97c2a1fSXin Li    stream_t *ps_stream = &ps_dec->s_bit_stream;
*a97c2a1fSXin Li    WORD32  u4_pos;
*a97c2a1fSXin Li    UWORD32 u4_nz_cols;
*a97c2a1fSXin Li    UWORD32 u4_nz_rows;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    *pi4_num_coeffs = 0;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    ps_dec->u4_non_zero_cols = 0;
*a97c2a1fSXin Li    ps_dec->u4_non_zero_rows = 0;
*a97c2a1fSXin Li    u4_nz_cols = ps_dec->u4_non_zero_cols;
*a97c2a1fSXin Li    u4_nz_rows = ps_dec->u4_non_zero_rows;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    GET_TEMP_STREAM_DATA(u4_buf,u4_buf_nxt,u4_offset,pu4_buf_aligned,ps_stream)
*a97c2a1fSXin Li    /**************************************************************************/
*a97c2a1fSXin Li    /* Decode the DC coefficient in case of Intra block                       */
*a97c2a1fSXin Li    /**************************************************************************/
*a97c2a1fSXin Li    if(u2_intra_flag)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        WORD32 dc_size;
*a97c2a1fSXin Li        WORD32 dc_diff;
*a97c2a1fSXin Li        WORD32 maxLen;
*a97c2a1fSXin Li        WORD32 idx;
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li        maxLen = MPEG2_DCT_DC_SIZE_LEN;
*a97c2a1fSXin Li        idx = 0;
*a97c2a1fSXin Li        if(u2_chroma_flag != 0)
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            maxLen += 1;
*a97c2a1fSXin Li            idx++;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            WORD16  end = 0;
*a97c2a1fSXin Li            UWORD32 maxLen_tmp = maxLen;
*a97c2a1fSXin Li            UWORD16 m_iBit;
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li            /* Get the maximum number of bits needed to decode a symbol */
*a97c2a1fSXin Li            IBITS_NXT(u4_buf,u4_buf_nxt,u4_offset,u4_bits,maxLen)
*a97c2a1fSXin Li            do
*a97c2a1fSXin Li            {
*a97c2a1fSXin Li                maxLen_tmp--;
*a97c2a1fSXin Li                /* Read one bit at a time from the variable to decode the huffman code */
*a97c2a1fSXin Li                m_iBit = (UWORD8)((u4_bits >> maxLen_tmp) & 0x1);
*a97c2a1fSXin Li
*a97c2a1fSXin Li                /* Get the next node pointer or the symbol from the tree */
*a97c2a1fSXin Li                end = gai2_impeg2d_dct_dc_size[idx][end][m_iBit];
*a97c2a1fSXin Li            }while(end > 0);
*a97c2a1fSXin Li            dc_size = end + MPEG2_DCT_DC_SIZE_OFFSET;
*a97c2a1fSXin Li
*a97c2a1fSXin Li            /* Flush the appropriate number of bits from the stream */
*a97c2a1fSXin Li            FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,(maxLen - maxLen_tmp),pu4_buf_aligned)
*a97c2a1fSXin Li
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li        if (dc_size != 0)
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            UWORD32 u4_bits;
*a97c2a1fSXin Li
*a97c2a1fSXin Li            IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned, dc_size)
*a97c2a1fSXin Li            dc_diff = u4_bits;
*a97c2a1fSXin Li
*a97c2a1fSXin Li            if ((dc_diff & (1 << (dc_size - 1))) == 0) //v Probably the prediction algo?
*a97c2a1fSXin Li                dc_diff -= (1 << dc_size) - 1;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li        else
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            dc_diff = 0;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li        pi2_outAddr[*pi4_num_coeffs]    = dc_diff;
*a97c2a1fSXin Li        /* This indicates the position of the coefficient. Since this is the DC
*a97c2a1fSXin Li         * coefficient, we put the position as 0.
*a97c2a1fSXin Li         */
*a97c2a1fSXin Li        pu1_pos[*pi4_num_coeffs]    = pu1_scan[0];
*a97c2a1fSXin Li        (*pi4_num_coeffs)++;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        if (0 != dc_diff)
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            u4_nz_cols |= 0x01;
*a97c2a1fSXin Li            u4_nz_rows |= 0x01;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li        u4_numCoeffs = 1;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    /**************************************************************************/
*a97c2a1fSXin Li    /* Decoding of first AC coefficient in case of non Intra block            */
*a97c2a1fSXin Li    /**************************************************************************/
*a97c2a1fSXin Li    else
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        /* First symbol can be 1s */
*a97c2a1fSXin Li        UWORD32 u4_bits;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        IBITS_NXT(u4_buf,u4_buf_nxt,u4_offset,u4_bits,1)
*a97c2a1fSXin Li
*a97c2a1fSXin Li        if(u4_bits == 1)
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li
*a97c2a1fSXin Li            FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,1, pu4_buf_aligned)
*a97c2a1fSXin Li            IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned, 1)
*a97c2a1fSXin Li            if(u4_bits == 1)
*a97c2a1fSXin Li            {
*a97c2a1fSXin Li                pi2_outAddr[*pi4_num_coeffs] = -1;
*a97c2a1fSXin Li            }
*a97c2a1fSXin Li            else
*a97c2a1fSXin Li            {
*a97c2a1fSXin Li                pi2_outAddr[*pi4_num_coeffs] = 1;
*a97c2a1fSXin Li            }
*a97c2a1fSXin Li
*a97c2a1fSXin Li            /* This indicates the position of the coefficient. Since this is the DC
*a97c2a1fSXin Li             * coefficient, we put the position as 0.
*a97c2a1fSXin Li             */
*a97c2a1fSXin Li            pu1_pos[*pi4_num_coeffs]    = pu1_scan[0];
*a97c2a1fSXin Li            (*pi4_num_coeffs)++;
*a97c2a1fSXin Li            u4_numCoeffs = 1;
*a97c2a1fSXin Li
*a97c2a1fSXin Li            u4_nz_cols |= 0x01;
*a97c2a1fSXin Li            u4_nz_rows |= 0x01;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li        else
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            u4_numCoeffs = 0;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    if (1 == u2_d_picture)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        PUT_TEMP_STREAM_DATA(u4_buf, u4_buf_nxt, u4_offset, pu4_buf_aligned, ps_stream)
*a97c2a1fSXin Li        ps_dec->u4_non_zero_cols  = u4_nz_cols;
*a97c2a1fSXin Li        ps_dec->u4_non_zero_rows  = u4_nz_rows;
*a97c2a1fSXin Li        return ((IMPEG2D_ERROR_CODES_T)IVD_ERROR_NONE);
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li        if (1 == u2_intra_vlc_format && u2_intra_flag)
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li
*a97c2a1fSXin Li            while(1)
*a97c2a1fSXin Li            {
*a97c2a1fSXin Li                //Putting the impeg2d_dec_ac_coeff_one function inline.
*a97c2a1fSXin Li
*a97c2a1fSXin Li                UWORD32 lead_zeros;
*a97c2a1fSXin Li                WORD16 DecodedValue;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                u4_sym_len = 17;
*a97c2a1fSXin Li                IBITS_NXT(u4_buf,u4_buf_nxt,u4_offset,u4_bits,u4_sym_len)
*a97c2a1fSXin Li
*a97c2a1fSXin Li                /* There cannot be more than 11 leading zeros in the decoded
*a97c2a1fSXin Li                 * symbol. The symbol is only 17 bits long, so we subtract 15.
*a97c2a1fSXin Li                 */
*a97c2a1fSXin Li                lead_zeros = CLZ(u4_bits) - 15;
*a97c2a1fSXin Li                if (lead_zeros > 11)
*a97c2a1fSXin Li                {
*a97c2a1fSXin Li                    return IMPEG2D_MB_DATA_DECODE_ERR;
*a97c2a1fSXin Li                }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                DecodedValue = gau2_impeg2d_tab_one_1_9[u4_bits >> 8];
*a97c2a1fSXin Li                u4_sym_len = (DecodedValue & 0xf);
*a97c2a1fSXin Li                i4_level = DecodedValue >> 9;
*a97c2a1fSXin Li                /* One table lookup */
*a97c2a1fSXin Li                if(0 != i4_level)
*a97c2a1fSXin Li                {
*a97c2a1fSXin Li                    u4_run = ((DecodedValue >> 4) & 0x1f);
*a97c2a1fSXin Li                    u4_numCoeffs       += u4_run;
*a97c2a1fSXin Li                    if (u4_numCoeffs >= NUM_COEFFS)
*a97c2a1fSXin Li                    {
*a97c2a1fSXin Li                        return IMPEG2D_MB_TEX_DECODE_ERR;
*a97c2a1fSXin Li                    }
*a97c2a1fSXin Li                    u4_pos             = pu1_scan[u4_numCoeffs++];
*a97c2a1fSXin Li                    pu1_pos[*pi4_num_coeffs]    = u4_pos;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                    FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,u4_sym_len,pu4_buf_aligned)
*a97c2a1fSXin Li                    pi2_outAddr[*pi4_num_coeffs]    = i4_level;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                    (*pi4_num_coeffs)++;
*a97c2a1fSXin Li                }
*a97c2a1fSXin Li                else
*a97c2a1fSXin Li                {
*a97c2a1fSXin Li                    if (DecodedValue == END_OF_BLOCK_ONE)
*a97c2a1fSXin Li                    {
*a97c2a1fSXin Li                        u4_sym_len = 4;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                        break;
*a97c2a1fSXin Li                    }
*a97c2a1fSXin Li                    else
*a97c2a1fSXin Li                    {
*a97c2a1fSXin Li                        /*Second table lookup*/
*a97c2a1fSXin Li                        lead_zeros = CLZ(u4_bits) - 20;/* -16 since we are dealing with WORD32 */
*a97c2a1fSXin Li                        if (0 != lead_zeros)
*a97c2a1fSXin Li                        {
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_bits         = (u4_bits >> (6 - lead_zeros)) & 0x001F;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            /* Flush the number of bits */
*a97c2a1fSXin Li                            if (1 == lead_zeros)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                u4_sym_len         = ((u4_bits & 0x18) >> 3) == 2 ? 11:10;
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li                            else
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                u4_sym_len         = 11 + lead_zeros;
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li                            /* flushing */
*a97c2a1fSXin Li                            FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,u4_sym_len,pu4_buf_aligned)
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            /* Calculate the address */
*a97c2a1fSXin Li                            u4_bits         = ((lead_zeros - 1) << 5) + u4_bits;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            DecodedValue    = gau2_impeg2d_tab_one_10_16[u4_bits];
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_run = BITS(DecodedValue, 8,4);
*a97c2a1fSXin Li                            i4_level = ((WORD16) DecodedValue) >> 9;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_numCoeffs       += u4_run;
*a97c2a1fSXin Li                            if (u4_numCoeffs >= NUM_COEFFS)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                return IMPEG2D_MB_TEX_DECODE_ERR;
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li                            u4_pos             = pu1_scan[u4_numCoeffs++];
*a97c2a1fSXin Li                            pu1_pos[*pi4_num_coeffs]    = u4_pos;
*a97c2a1fSXin Li                            pi2_outAddr[*pi4_num_coeffs]    = i4_level;
*a97c2a1fSXin Li                            (*pi4_num_coeffs)++;
*a97c2a1fSXin Li                        }
*a97c2a1fSXin Li                        /*********************************************************************/
*a97c2a1fSXin Li                        /* MPEG2 Escape Code                                                 */
*a97c2a1fSXin Li                        /*********************************************************************/
*a97c2a1fSXin Li                        else if(u2_mpeg2 == 1)
*a97c2a1fSXin Li                        {
*a97c2a1fSXin Li                            u4_sym_len         = 6;
*a97c2a1fSXin Li                            FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,u4_sym_len,pu4_buf_aligned)
*a97c2a1fSXin Li                                IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned,18)
*a97c2a1fSXin Li                                u4_decoded_value    = u4_bits;
*a97c2a1fSXin Li                            u4_run             = (u4_decoded_value >> 12);
*a97c2a1fSXin Li                            i4_level           = (u4_decoded_value & 0x0FFF);
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            if (i4_level)
*a97c2a1fSXin Li                                i4_level = (i4_level - ((i4_level & 0x0800) << 1));
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_numCoeffs       += u4_run;
*a97c2a1fSXin Li                            if (u4_numCoeffs >= NUM_COEFFS)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                return IMPEG2D_MB_TEX_DECODE_ERR;
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li                            u4_pos             = pu1_scan[u4_numCoeffs++];
*a97c2a1fSXin Li                            pu1_pos[*pi4_num_coeffs]    = u4_pos;
*a97c2a1fSXin Li                            pi2_outAddr[*pi4_num_coeffs]    = i4_level;
*a97c2a1fSXin Li                            (*pi4_num_coeffs)++;
*a97c2a1fSXin Li                        }
*a97c2a1fSXin Li                        /*********************************************************************/
*a97c2a1fSXin Li                        /* MPEG1 Escape Code                                                 */
*a97c2a1fSXin Li                        /*********************************************************************/
*a97c2a1fSXin Li                        else
*a97c2a1fSXin Li                        {
*a97c2a1fSXin Li                            /*-----------------------------------------------------------
*a97c2a1fSXin Li                            * MPEG-1 Stream
*a97c2a1fSXin Li                            *
*a97c2a1fSXin Li                            * <See D.9.3 of MPEG-2> Run-level escape syntax
*a97c2a1fSXin Li                            * Run-level values that cannot be coded with a VLC are coded
*a97c2a1fSXin Li                            * by the escape code '0000 01' followed by
*a97c2a1fSXin Li                            * either a 14-bit FLC (127 <= level <= 127),
*a97c2a1fSXin Li                            * or a 22-bit FLC (255 <= level <= 255).
*a97c2a1fSXin Li                            * This is described in Annex B,B.5f of MPEG-1.standard
*a97c2a1fSXin Li                            *-----------------------------------------------------------*/
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            /*-----------------------------------------------------------
*a97c2a1fSXin Li                            * First 6 bits are the value of the Run. Next is First 8 bits
*a97c2a1fSXin Li                            * of Level. These bits decide whether it is 14 bit FLC or
*a97c2a1fSXin Li                            * 22-bit FLC.
*a97c2a1fSXin Li                            *
*a97c2a1fSXin Li                            * If( first 8 bits of Level == '1000000' or '00000000')
*a97c2a1fSXin Li                            *      then its is 22-bit FLC.
*a97c2a1fSXin Li                            * else
*a97c2a1fSXin Li                            *      it is 14-bit FLC.
*a97c2a1fSXin Li                            *-----------------------------------------------------------*/
*a97c2a1fSXin Li                            u4_sym_len         = 6;
*a97c2a1fSXin Li                            FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,u4_sym_len,pu4_buf_aligned)
*a97c2a1fSXin Li                                IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned,14)
*a97c2a1fSXin Li                                u4_decoded_value     = u4_bits;
*a97c2a1fSXin Li                            u4_run              = (u4_decoded_value >> 8);
*a97c2a1fSXin Li                            i4_level_first_byte = (u4_decoded_value & 0x0FF);
*a97c2a1fSXin Li                            if(i4_level_first_byte & 0x7F)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                /*-------------------------------------------------------
*a97c2a1fSXin Li                                * First 8 bits of level are neither 1000000 nor 00000000
*a97c2a1fSXin Li                                * Hence 14-bit FLC (Last 8 bits are used to get level)
*a97c2a1fSXin Li                                *
*a97c2a1fSXin Li                                *  Level = (msb of Level_First_Byte is 1)?
*a97c2a1fSXin Li                                *          Level_First_Byte - 256 : Level_First_Byte
*a97c2a1fSXin Li                                *-------------------------------------------------------*/
*a97c2a1fSXin Li                                i4_level = (i4_level_first_byte -
*a97c2a1fSXin Li                                    ((i4_level_first_byte & 0x80) << 1));
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li                            else
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                /*-------------------------------------------------------
*a97c2a1fSXin Li                                * Next 8 bits are either 1000000 or 00000000
*a97c2a1fSXin Li                                * Hence 22-bit FLC (Last 16 bits are used to get level)
*a97c2a1fSXin Li                                *
*a97c2a1fSXin Li                                *  Level = (msb of Level_First_Byte is 1)?
*a97c2a1fSXin Li                                *          Level_Second_Byte - 256 : Level_Second_Byte
*a97c2a1fSXin Li                                *-------------------------------------------------------*/
*a97c2a1fSXin Li                                IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned,8)
*a97c2a1fSXin Li                                    i4_level = u4_bits;
*a97c2a1fSXin Li                                i4_level = (i4_level - (i4_level_first_byte << 1));
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li                            u4_numCoeffs += u4_run;
*a97c2a1fSXin Li                            if (u4_numCoeffs >= NUM_COEFFS)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                return IMPEG2D_MB_TEX_DECODE_ERR;
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_pos = pu1_scan[u4_numCoeffs++];
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            pu1_pos[*pi4_num_coeffs]    = u4_pos;
*a97c2a1fSXin Li                            pi2_outAddr[*pi4_num_coeffs]    = i4_level;
*a97c2a1fSXin Li                            (*pi4_num_coeffs)++;
*a97c2a1fSXin Li                        }
*a97c2a1fSXin Li                    }
*a97c2a1fSXin Li                }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                u4_nz_cols |= 1 << (u4_pos & 0x7);
*a97c2a1fSXin Li                u4_nz_rows |= 1 << (u4_pos >> 0x3);
*a97c2a1fSXin Li
*a97c2a1fSXin Li            }
*a97c2a1fSXin Li            IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned,u4_sym_len)
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li        else
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            // Inline
*a97c2a1fSXin Li            while(1)
*a97c2a1fSXin Li            {
*a97c2a1fSXin Li
*a97c2a1fSXin Li                UWORD32 lead_zeros;
*a97c2a1fSXin Li                UWORD16 DecodedValue;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                u4_sym_len = 17;
*a97c2a1fSXin Li                IBITS_NXT(u4_buf, u4_buf_nxt, u4_offset, u4_bits, u4_sym_len)
*a97c2a1fSXin Li
*a97c2a1fSXin Li                /* There cannot be more than 11 leading zeros in the decoded
*a97c2a1fSXin Li                 * symbol. The symbol is only 17 bits long, so we subtract 15.
*a97c2a1fSXin Li                 */
*a97c2a1fSXin Li                lead_zeros = CLZ(u4_bits) - 15;
*a97c2a1fSXin Li                if (lead_zeros > 11)
*a97c2a1fSXin Li                {
*a97c2a1fSXin Li                    return IMPEG2D_MB_DATA_DECODE_ERR;
*a97c2a1fSXin Li                }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                DecodedValue = gau2_impeg2d_tab_zero_1_9[u4_bits >> 8];
*a97c2a1fSXin Li                u4_sym_len = BITS(DecodedValue, 3, 0);
*a97c2a1fSXin Li                i4_level = ((WORD16) DecodedValue) >> 9;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                if (0 != i4_level)
*a97c2a1fSXin Li                {
*a97c2a1fSXin Li                    u4_run = BITS(DecodedValue, 8,4);
*a97c2a1fSXin Li
*a97c2a1fSXin Li                    u4_numCoeffs       += u4_run;
*a97c2a1fSXin Li                    if (u4_numCoeffs >= NUM_COEFFS)
*a97c2a1fSXin Li                    {
*a97c2a1fSXin Li                        return IMPEG2D_MB_TEX_DECODE_ERR;
*a97c2a1fSXin Li                    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                    u4_pos                 = pu1_scan[u4_numCoeffs++];
*a97c2a1fSXin Li                    pu1_pos[*pi4_num_coeffs]    = u4_pos;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                    FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,u4_sym_len,pu4_buf_aligned)
*a97c2a1fSXin Li                    pi2_outAddr[*pi4_num_coeffs]    = i4_level;
*a97c2a1fSXin Li                    (*pi4_num_coeffs)++;
*a97c2a1fSXin Li                }
*a97c2a1fSXin Li                else
*a97c2a1fSXin Li                {
*a97c2a1fSXin Li                    if(DecodedValue == END_OF_BLOCK_ZERO)
*a97c2a1fSXin Li                    {
*a97c2a1fSXin Li                        u4_sym_len = 2;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                        break;
*a97c2a1fSXin Li                    }
*a97c2a1fSXin Li                    else
*a97c2a1fSXin Li                    {
*a97c2a1fSXin Li                        lead_zeros = CLZ(u4_bits) - 20;/* -15 since we are dealing with WORD32 */
*a97c2a1fSXin Li                        /*Second table lookup*/
*a97c2a1fSXin Li                        if (0 != lead_zeros)
*a97c2a1fSXin Li                        {
*a97c2a1fSXin Li                            u4_bits         = (u4_bits >> (6 - lead_zeros)) & 0x001F;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            /* Flush the number of bits */
*a97c2a1fSXin Li                            u4_sym_len         = 11 + lead_zeros;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            /* Calculate the address */
*a97c2a1fSXin Li                            u4_bits         = ((lead_zeros - 1) << 5) + u4_bits;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            DecodedValue    = gau2_impeg2d_tab_zero_10_16[u4_bits];
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_run = BITS(DecodedValue, 8,4);
*a97c2a1fSXin Li                            i4_level = ((WORD16) DecodedValue) >> 9;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_numCoeffs       += u4_run;
*a97c2a1fSXin Li                            if (u4_numCoeffs >= NUM_COEFFS)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                return IMPEG2D_MB_TEX_DECODE_ERR;
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_pos                 = pu1_scan[u4_numCoeffs++];
*a97c2a1fSXin Li                            pu1_pos[*pi4_num_coeffs]    = u4_pos;
*a97c2a1fSXin Li                            if (1 == lead_zeros)
*a97c2a1fSXin Li                                u4_sym_len--;
*a97c2a1fSXin Li                            /* flushing */
*a97c2a1fSXin Li                            FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,u4_sym_len,pu4_buf_aligned)
*a97c2a1fSXin Li                            pi2_outAddr[*pi4_num_coeffs]    = i4_level;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            (*pi4_num_coeffs)++;
*a97c2a1fSXin Li                        }
*a97c2a1fSXin Li                        /*Escape Sequence*/
*a97c2a1fSXin Li                        else if(u2_mpeg2 == 1)
*a97c2a1fSXin Li                        {
*a97c2a1fSXin Li                            u4_sym_len         = 6;
*a97c2a1fSXin Li                            FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,u4_sym_len,pu4_buf_aligned)
*a97c2a1fSXin Li                            IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned,18)
*a97c2a1fSXin Li                            u4_decoded_value    = u4_bits;
*a97c2a1fSXin Li                            u4_run             = (u4_decoded_value >> 12);
*a97c2a1fSXin Li                            i4_level           = (u4_decoded_value & 0x0FFF);
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            if (i4_level)
*a97c2a1fSXin Li                                i4_level = (i4_level - ((i4_level & 0x0800) << 1));
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_numCoeffs           += u4_run;
*a97c2a1fSXin Li                            if (u4_numCoeffs >= NUM_COEFFS)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                return IMPEG2D_MB_TEX_DECODE_ERR;
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_pos                 = pu1_scan[u4_numCoeffs++];
*a97c2a1fSXin Li                            pu1_pos[*pi4_num_coeffs]    = u4_pos;
*a97c2a1fSXin Li                            pi2_outAddr[*pi4_num_coeffs]    = i4_level;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            (*pi4_num_coeffs)++;
*a97c2a1fSXin Li                        }
*a97c2a1fSXin Li                        /*********************************************************************/
*a97c2a1fSXin Li                        /* MPEG1 Escape Code                                                 */
*a97c2a1fSXin Li                        /*********************************************************************/
*a97c2a1fSXin Li                        else
*a97c2a1fSXin Li                        {
*a97c2a1fSXin Li                            /*-----------------------------------------------------------
*a97c2a1fSXin Li                            * MPEG-1 Stream
*a97c2a1fSXin Li                            *
*a97c2a1fSXin Li                            * <See D.9.3 of MPEG-2> Run-level escape syntax
*a97c2a1fSXin Li                            * Run-level values that cannot be coded with a VLC are coded
*a97c2a1fSXin Li                            * by the escape code '0000 01' followed by
*a97c2a1fSXin Li                            * either a 14-bit FLC (127 <= level <= 127),
*a97c2a1fSXin Li                            * or a 22-bit FLC (255 <= level <= 255).
*a97c2a1fSXin Li                            * This is described in Annex B,B.5f of MPEG-1.standard
*a97c2a1fSXin Li                            *-----------------------------------------------------------*/
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            /*-----------------------------------------------------------
*a97c2a1fSXin Li                            * First 6 bits are the value of the Run. Next is First 8 bits
*a97c2a1fSXin Li                            * of Level. These bits decide whether it is 14 bit FLC or
*a97c2a1fSXin Li                            * 22-bit FLC.
*a97c2a1fSXin Li                            *
*a97c2a1fSXin Li                            * If( first 8 bits of Level == '1000000' or '00000000')
*a97c2a1fSXin Li                            *      then its is 22-bit FLC.
*a97c2a1fSXin Li                            * else
*a97c2a1fSXin Li                            *      it is 14-bit FLC.
*a97c2a1fSXin Li                            *-----------------------------------------------------------*/
*a97c2a1fSXin Li                            u4_sym_len             = 6;
*a97c2a1fSXin Li                            FLUSH_BITS(u4_offset,u4_buf,u4_buf_nxt,u4_sym_len,pu4_buf_aligned)
*a97c2a1fSXin Li                            IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned,14)
*a97c2a1fSXin Li                            u4_decoded_value        = u4_bits;
*a97c2a1fSXin Li                            u4_run                 = (u4_decoded_value >> 8);
*a97c2a1fSXin Li                            i4_level_first_byte    = (u4_decoded_value & 0x0FF);
*a97c2a1fSXin Li                            if(i4_level_first_byte & 0x7F)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                /*-------------------------------------------------------
*a97c2a1fSXin Li                                * First 8 bits of level are neither 1000000 nor 00000000
*a97c2a1fSXin Li                                * Hence 14-bit FLC (Last 8 bits are used to get level)
*a97c2a1fSXin Li                                *
*a97c2a1fSXin Li                                *  Level = (msb of Level_First_Byte is 1)?
*a97c2a1fSXin Li                                *          Level_First_Byte - 256 : Level_First_Byte
*a97c2a1fSXin Li                                *-------------------------------------------------------*/
*a97c2a1fSXin Li                                i4_level = (i4_level_first_byte -
*a97c2a1fSXin Li                                    ((i4_level_first_byte & 0x80) << 1));
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li                            else
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                /*-------------------------------------------------------
*a97c2a1fSXin Li                                * Next 8 bits are either 1000000 or 00000000
*a97c2a1fSXin Li                                * Hence 22-bit FLC (Last 16 bits are used to get level)
*a97c2a1fSXin Li                                *
*a97c2a1fSXin Li                                *  Level = (msb of Level_First_Byte is 1)?
*a97c2a1fSXin Li                                *          Level_Second_Byte - 256 : Level_Second_Byte
*a97c2a1fSXin Li                                *-------------------------------------------------------*/
*a97c2a1fSXin Li                                IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned,8)
*a97c2a1fSXin Li                                i4_level = u4_bits;
*a97c2a1fSXin Li                                i4_level = (i4_level - (i4_level_first_byte << 1));
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li                            u4_numCoeffs           += u4_run;
*a97c2a1fSXin Li                            if (u4_numCoeffs >= NUM_COEFFS)
*a97c2a1fSXin Li                            {
*a97c2a1fSXin Li                                return IMPEG2D_MB_TEX_DECODE_ERR;
*a97c2a1fSXin Li                            }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            u4_pos                 = pu1_scan[u4_numCoeffs++];
*a97c2a1fSXin Li                            pu1_pos[*pi4_num_coeffs]    = u4_pos;
*a97c2a1fSXin Li                            pi2_outAddr[*pi4_num_coeffs]    = i4_level;
*a97c2a1fSXin Li
*a97c2a1fSXin Li                            (*pi4_num_coeffs)++;
*a97c2a1fSXin Li                        }
*a97c2a1fSXin Li                    }
*a97c2a1fSXin Li                }
*a97c2a1fSXin Li
*a97c2a1fSXin Li                u4_nz_cols |= 1 << (u4_pos & 0x7);
*a97c2a1fSXin Li                u4_nz_rows |= 1 << (u4_pos >> 0x3);
*a97c2a1fSXin Li
*a97c2a1fSXin Li            }
*a97c2a1fSXin Li
*a97c2a1fSXin Li            IBITS_GET(u4_buf,u4_buf_nxt,u4_offset,u4_bits,pu4_buf_aligned,u4_sym_len)
*a97c2a1fSXin Li
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li        PUT_TEMP_STREAM_DATA(u4_buf, u4_buf_nxt, u4_offset, pu4_buf_aligned, ps_stream)
*a97c2a1fSXin Li
*a97c2a1fSXin Li        ps_dec->u4_non_zero_cols  = u4_nz_cols;
*a97c2a1fSXin Li        ps_dec->u4_non_zero_rows  = u4_nz_rows;
*a97c2a1fSXin Li
*a97c2a1fSXin Li            return (IMPEG2D_ERROR_CODES_T)IVD_ERROR_NONE;
*a97c2a1fSXin Li}
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li/*****************************************************************************/
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Function Name : impeg2d_inv_quant_mpeg1                                   */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Description   : Inverse quantizes the output of VLD                      */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Inputs        :                                                          */
*a97c2a1fSXin Li/*  blk,              - Block to be inverse quantized                        */
*a97c2a1fSXin Li/*  weighting_matrix  - Matrix to be used in inverse quant                   */
*a97c2a1fSXin Li/*  intra_dc_precision- Precision reqd to scale intra DC value               */
*a97c2a1fSXin Li/*  quant_scale       - Quanization scale for inverse quant                  */
*a97c2a1fSXin Li/*  intra_flag        - Intra or Not                                         */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Globals       : None                                                     */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Processing    : Implements the inverse quantize equation                 */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Outputs       : Inverse quantized values in the block                    */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Returns       : None                                                     */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Issues        : None                                                     */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Revision History:                                                        */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*         DD MM YYYY   Author(s)       Changes                              */
*a97c2a1fSXin Li/*         05 09 2005   Harish M        First Version                        */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*****************************************************************************/
*a97c2a1fSXin LiWORD32 impeg2d_inv_quant_mpeg1(WORD16 *pi2_blk,
*a97c2a1fSXin Li                              UWORD8 *pu1_weighting_matrix,
*a97c2a1fSXin Li                              UWORD8 u1_quant_scale,
*a97c2a1fSXin Li                              WORD32 u4_intra_flag,
*a97c2a1fSXin Li                              WORD32 i4_num_coeffs,
*a97c2a1fSXin Li                              WORD16 *pi2_coeffs,
*a97c2a1fSXin Li                              UWORD8 *pu1_pos,
*a97c2a1fSXin Li                              const UWORD8 *pu1_scan,
*a97c2a1fSXin Li                              UWORD16 *pu2_def_dc_pred,
*a97c2a1fSXin Li                              UWORD16 u2_intra_dc_precision)
*a97c2a1fSXin Li{
*a97c2a1fSXin Li    UWORD16 i4_pos;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    WORD32  i4_iter;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /* Inverse Quantize the predicted DC value for intra MB*/
*a97c2a1fSXin Li    if(u4_intra_flag == 1)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        /**************************************************************************/
*a97c2a1fSXin Li        /* Decode the DC coefficient in case of Intra block and also update       */
*a97c2a1fSXin Li        /* DC predictor value of the corresponding color component                */
*a97c2a1fSXin Li        /**************************************************************************/
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            pi2_coeffs[0]   += *pu2_def_dc_pred;
*a97c2a1fSXin Li            *pu2_def_dc_pred      = pi2_coeffs[0];
*a97c2a1fSXin Li            pi2_coeffs[0]   <<= (3 - u2_intra_dc_precision);
*a97c2a1fSXin Li            pi2_coeffs[0]   = CLIP_S12(pi2_coeffs[0]);
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li        pi2_blk[pu1_scan[0]]  = pi2_coeffs[0];
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    /************************************************************************/
*a97c2a1fSXin Li    /* Inverse quantization of other DCT coefficients                       */
*a97c2a1fSXin Li    /************************************************************************/
*a97c2a1fSXin Li    for(i4_iter = u4_intra_flag; i4_iter < i4_num_coeffs; i4_iter++)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li
*a97c2a1fSXin Li        WORD16 sign;
*a97c2a1fSXin Li        WORD32 temp, temp1;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        /* Position is the inverse scan of the index stored */
*a97c2a1fSXin Li        i4_pos      = pu1_pos[i4_iter];
*a97c2a1fSXin Li        pi2_blk[i4_pos] = pi2_coeffs[i4_iter];
*a97c2a1fSXin Li
*a97c2a1fSXin Li        sign = SIGN(pi2_blk[i4_pos]);
*a97c2a1fSXin Li        temp = ABS(pi2_blk[i4_pos] << 1);
*a97c2a1fSXin Li
*a97c2a1fSXin Li        /* pi2_coeffs has only non-zero elements. So no need to check
*a97c2a1fSXin Li         * if the coeff is non-zero.
*a97c2a1fSXin Li         */
*a97c2a1fSXin Li        temp = temp + (1 * !u4_intra_flag);
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp = temp * pu1_weighting_matrix[i4_pos] * u1_quant_scale;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp = temp >> 5;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp1 = temp | 1;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp1 = (temp1 > temp) ? (temp1 - temp) : (temp - temp1);
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp = temp - temp1;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        if(temp < 0)
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            temp = 0;
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp = temp * sign;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp = CLIP_S12(temp);
*a97c2a1fSXin Li
*a97c2a1fSXin Li        pi2_blk[i4_pos] = temp;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /*return value is used in the case of mpeg2 for mismatch control*/
*a97c2a1fSXin Li    return  (0);
*a97c2a1fSXin Li} /* End of inv_quant() */
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li
*a97c2a1fSXin Li/*****************************************************************************/
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Function Name : impeg2d_inv_quant_mpeg2                                   */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Description   : Inverse quantizes the output of VLD                      */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Inputs        :                                                          */
*a97c2a1fSXin Li/*  blk,              - Block to be inverse quantized                        */
*a97c2a1fSXin Li/*  weighting_matrix  - Matrix to be used in inverse quant                   */
*a97c2a1fSXin Li/*  intra_dc_precision- Precision reqd to scale intra DC value               */
*a97c2a1fSXin Li/*  quant_scale       - Quanization scale for inverse quant                  */
*a97c2a1fSXin Li/*  intra_flag        - Intra or Not                                         */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Globals       : None                                                     */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Processing    : Implements the inverse quantize equation                 */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Outputs       : Inverse quantized values in the block                    */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Returns       : None                                                     */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Issues        : None                                                     */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*  Revision History:                                                        */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*         DD MM YYYY   Author(s)       Changes                              */
*a97c2a1fSXin Li/*         05 09 2005   Harish M        First Version                        */
*a97c2a1fSXin Li/*                                                                           */
*a97c2a1fSXin Li/*****************************************************************************/
*a97c2a1fSXin LiWORD32 impeg2d_inv_quant_mpeg2(WORD16 *pi2_blk,
*a97c2a1fSXin Li                              UWORD8 *pu1_weighting_matrix,
*a97c2a1fSXin Li                              UWORD8 u1_quant_scale,
*a97c2a1fSXin Li                              WORD32 u4_intra_flag,
*a97c2a1fSXin Li                              WORD32 i4_num_coeffs,
*a97c2a1fSXin Li                              WORD16 *pi2_coeffs,
*a97c2a1fSXin Li                              UWORD8 *pu1_pos,
*a97c2a1fSXin Li                              const UWORD8 *pu1_scan,
*a97c2a1fSXin Li                              UWORD16 *pu2_def_dc_pred,
*a97c2a1fSXin Li                              UWORD16 u2_intra_dc_precision)
*a97c2a1fSXin Li{
*a97c2a1fSXin Li
*a97c2a1fSXin Li    WORD32  i4_pos;
*a97c2a1fSXin Li    /* Used for Mismatch control */
*a97c2a1fSXin Li    WORD32 sum;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    WORD32  i4_iter;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    sum = 0;
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /* Inverse Quantize the predicted DC value for intra MB*/
*a97c2a1fSXin Li    if(u4_intra_flag == 1)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        /**************************************************************************/
*a97c2a1fSXin Li        /* Decode the DC coefficient in case of Intra block and also update       */
*a97c2a1fSXin Li        /* DC predictor value of the corresponding color component                */
*a97c2a1fSXin Li        /**************************************************************************/
*a97c2a1fSXin Li        {
*a97c2a1fSXin Li            pi2_coeffs[0]   += *pu2_def_dc_pred;
*a97c2a1fSXin Li            *pu2_def_dc_pred      = pi2_coeffs[0];
*a97c2a1fSXin Li            pi2_coeffs[0]   <<= (3 - u2_intra_dc_precision);
*a97c2a1fSXin Li            pi2_coeffs[0]   = CLIP_S12(pi2_coeffs[0]);
*a97c2a1fSXin Li        }
*a97c2a1fSXin Li
*a97c2a1fSXin Li        pi2_blk[pu1_scan[0]]  = pi2_coeffs[0];
*a97c2a1fSXin Li        sum = pi2_blk[0];
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li
*a97c2a1fSXin Li    /************************************************************************/
*a97c2a1fSXin Li    /* Inverse quantization of other DCT coefficients                       */
*a97c2a1fSXin Li    /************************************************************************/
*a97c2a1fSXin Li    for(i4_iter = u4_intra_flag; i4_iter < i4_num_coeffs; i4_iter++)
*a97c2a1fSXin Li    {
*a97c2a1fSXin Li        WORD16 sign;
*a97c2a1fSXin Li        WORD32 temp;
*a97c2a1fSXin Li        /* Position is the inverse scan of the index stored */
*a97c2a1fSXin Li        i4_pos      = pu1_pos[i4_iter];
*a97c2a1fSXin Li        pi2_blk[i4_pos] = pi2_coeffs[i4_iter];
*a97c2a1fSXin Li
*a97c2a1fSXin Li        sign = SIGN(pi2_blk[i4_pos]);
*a97c2a1fSXin Li        temp = ABS(pi2_blk[i4_pos] << 1);
*a97c2a1fSXin Li        temp = temp + (1 * !u4_intra_flag);
*a97c2a1fSXin Li        temp = temp * pu1_weighting_matrix[i4_pos] * u1_quant_scale;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp = temp >> 5;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp = temp * sign;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        temp = CLIP_S12(temp);
*a97c2a1fSXin Li
*a97c2a1fSXin Li        pi2_blk[i4_pos] = temp;
*a97c2a1fSXin Li
*a97c2a1fSXin Li        sum += temp;
*a97c2a1fSXin Li    }
*a97c2a1fSXin Li    return (sum ^ 1);
*a97c2a1fSXin Li} /* End of inv_quant() */