libopus/dnn/dred_encoder.c

*a58d3d2aSXin Li/* Copyright (c) 2022 Amazon
*a58d3d2aSXin Li   Written by Jan Buethe */
*a58d3d2aSXin Li/*
*a58d3d2aSXin Li   Redistribution and use in source and binary forms, with or without
*a58d3d2aSXin Li   modification, are permitted provided that the following conditions
*a58d3d2aSXin Li   are met:
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions of source code must retain the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   - Redistributions in binary form must reproduce the above copyright
*a58d3d2aSXin Li   notice, this list of conditions and the following disclaimer in the
*a58d3d2aSXin Li   documentation and/or other materials provided with the distribution.
*a58d3d2aSXin Li
*a58d3d2aSXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*a58d3d2aSXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*a58d3d2aSXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*a58d3d2aSXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
*a58d3d2aSXin Li   OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*a58d3d2aSXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*a58d3d2aSXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*a58d3d2aSXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*a58d3d2aSXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*a58d3d2aSXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*a58d3d2aSXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*a58d3d2aSXin Li*/
*a58d3d2aSXin Li
*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include <string.h>
*a58d3d2aSXin Li
*a58d3d2aSXin Li#if 0
*a58d3d2aSXin Li#include <stdio.h>
*a58d3d2aSXin Li#include <math.h>
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "dred_encoder.h"
*a58d3d2aSXin Li#include "dred_coding.h"
*a58d3d2aSXin Li#include "celt/entenc.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include "dred_decoder.h"
*a58d3d2aSXin Li#include "float_cast.h"
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li#include "celt/laplace.h"
*a58d3d2aSXin Li#include "dred_rdovae_stats_data.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void DRED_rdovae_init_encoder(RDOVAEEncState *enc_state)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    memset(enc_state, 0, sizeof(*enc_state));
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liint dred_encoder_load_model(DREDEnc* enc, const void *data, int len)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    WeightArray *list;
*a58d3d2aSXin Li    int ret;
*a58d3d2aSXin Li    parse_weights(&list, data, len);
*a58d3d2aSXin Li    ret = init_rdovaeenc(&enc->model, list);
*a58d3d2aSXin Li    opus_free(list);
*a58d3d2aSXin Li    if (ret == 0) {
*a58d3d2aSXin Li      ret = lpcnet_encoder_load_model(&enc->lpcnet_enc_state, data, len);
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    if (ret == 0) enc->loaded = 1;
*a58d3d2aSXin Li    return (ret == 0) ? OPUS_OK : OPUS_BAD_ARG;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid dred_encoder_reset(DREDEnc* enc)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    OPUS_CLEAR((char*)&enc->DREDENC_RESET_START,
*a58d3d2aSXin Li              sizeof(DREDEnc)-
*a58d3d2aSXin Li              ((char*)&enc->DREDENC_RESET_START - (char*)enc));
*a58d3d2aSXin Li    enc->input_buffer_fill = DRED_SILK_ENCODER_DELAY;
*a58d3d2aSXin Li    lpcnet_encoder_init(&enc->lpcnet_enc_state);
*a58d3d2aSXin Li    DRED_rdovae_init_encoder(&enc->rdovae_enc);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid dred_encoder_init(DREDEnc* enc, opus_int32 Fs, int channels)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    enc->Fs = Fs;
*a58d3d2aSXin Li    enc->channels = channels;
*a58d3d2aSXin Li    enc->loaded = 0;
*a58d3d2aSXin Li#ifndef USE_WEIGHTS_FILE
*a58d3d2aSXin Li    if (init_rdovaeenc(&enc->model, rdovaeenc_arrays) == 0) enc->loaded = 1;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li    dred_encoder_reset(enc);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void dred_process_frame(DREDEnc *enc, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    float feature_buffer[2 * 36];
*a58d3d2aSXin Li    float input_buffer[2*DRED_NUM_FEATURES] = {0};
*a58d3d2aSXin Li
*a58d3d2aSXin Li    celt_assert(enc->loaded);
*a58d3d2aSXin Li    /* shift latents buffer */
*a58d3d2aSXin Li    OPUS_MOVE(enc->latents_buffer + DRED_LATENT_DIM, enc->latents_buffer, (DRED_MAX_FRAMES - 1) * DRED_LATENT_DIM);
*a58d3d2aSXin Li    OPUS_MOVE(enc->state_buffer + DRED_STATE_DIM, enc->state_buffer, (DRED_MAX_FRAMES - 1) * DRED_STATE_DIM);
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* calculate LPCNet features */
*a58d3d2aSXin Li    lpcnet_compute_single_frame_features_float(&enc->lpcnet_enc_state, enc->input_buffer, feature_buffer, arch);
*a58d3d2aSXin Li    lpcnet_compute_single_frame_features_float(&enc->lpcnet_enc_state, enc->input_buffer + DRED_FRAME_SIZE, feature_buffer + 36, arch);
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* prepare input buffer (discard LPC coefficients) */
*a58d3d2aSXin Li    OPUS_COPY(input_buffer, feature_buffer, DRED_NUM_FEATURES);
*a58d3d2aSXin Li    OPUS_COPY(input_buffer + DRED_NUM_FEATURES, feature_buffer + 36, DRED_NUM_FEATURES);
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* run RDOVAE encoder */
*a58d3d2aSXin Li    dred_rdovae_encode_dframe(&enc->rdovae_enc, &enc->model, enc->latents_buffer, enc->state_buffer, input_buffer, arch);
*a58d3d2aSXin Li    enc->latents_buffer_fill = IMIN(enc->latents_buffer_fill+1, DRED_NUM_REDUNDANCY_FRAMES);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid filter_df2t(const float *in, float *out, int len, float b0, const float *b, const float *a, int order, float *mem)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    int i;
*a58d3d2aSXin Li    for (i=0;i<len;i++) {
*a58d3d2aSXin Li        int j;
*a58d3d2aSXin Li        float xi, yi, nyi;
*a58d3d2aSXin Li        xi = in[i];
*a58d3d2aSXin Li        yi = xi*b0 + mem[0];
*a58d3d2aSXin Li        nyi = -yi;
*a58d3d2aSXin Li        for (j=0;j<order;j++)
*a58d3d2aSXin Li        {
*a58d3d2aSXin Li           mem[j] = mem[j+1] + b[j]*xi + a[j]*nyi;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        out[i] = yi;
*a58d3d2aSXin Li        /*fprintf(stdout, "%f\n", out[i]);*/
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li#define MAX_DOWNMIX_BUFFER (960*2)
*a58d3d2aSXin Listatic void dred_convert_to_16k(DREDEnc *enc, const float *in, int in_len, float *out, int out_len)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    float downmix[MAX_DOWNMIX_BUFFER];
*a58d3d2aSXin Li    int i;
*a58d3d2aSXin Li    int up;
*a58d3d2aSXin Li    celt_assert(enc->channels*in_len <= MAX_DOWNMIX_BUFFER);
*a58d3d2aSXin Li    celt_assert(in_len * (opus_int32)16000 == out_len * enc->Fs);
*a58d3d2aSXin Li    switch(enc->Fs) {
*a58d3d2aSXin Li        case 8000:
*a58d3d2aSXin Li            up = 2;
*a58d3d2aSXin Li            break;
*a58d3d2aSXin Li        case 12000:
*a58d3d2aSXin Li            up = 4;
*a58d3d2aSXin Li            break;
*a58d3d2aSXin Li        case 16000:
*a58d3d2aSXin Li            up = 1;
*a58d3d2aSXin Li            break;
*a58d3d2aSXin Li        case 24000:
*a58d3d2aSXin Li            up = 2;
*a58d3d2aSXin Li            break;
*a58d3d2aSXin Li        case 48000:
*a58d3d2aSXin Li            up = 1;
*a58d3d2aSXin Li            break;
*a58d3d2aSXin Li        default:
*a58d3d2aSXin Li            celt_assert(0);
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    OPUS_CLEAR(downmix, up*in_len);
*a58d3d2aSXin Li    if (enc->channels == 1) {
*a58d3d2aSXin Li        for (i=0;i<in_len;i++) downmix[up*i] = FLOAT2INT16(up*in[i]);
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li        for (i=0;i<in_len;i++) downmix[up*i] = FLOAT2INT16(.5*up*(in[2*i]+in[2*i+1]));
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    if (enc->Fs == 16000) {
*a58d3d2aSXin Li        OPUS_COPY(out, downmix, out_len);
*a58d3d2aSXin Li    } else if (enc->Fs == 48000 || enc->Fs == 24000) {
*a58d3d2aSXin Li        /* ellip(7, .2, 70, 7750/24000) */
*a58d3d2aSXin Li
*a58d3d2aSXin Li        static const float filter_b[8] = { 0.005873358047f,  0.012980854831f, 0.014531340042f,  0.014531340042f, 0.012980854831f,  0.005873358047f, 0.004523418224f, 0.f};
*a58d3d2aSXin Li        static const float filter_a[8] = {-3.878718597768f, 7.748834257468f, -9.653651699533f, 8.007342726666f, -4.379450178552f, 1.463182111810f, -0.231720677804f, 0.f};
*a58d3d2aSXin Li        float b0 = 0.004523418224f;
*a58d3d2aSXin Li        filter_df2t(downmix, downmix, up*in_len, b0, filter_b, filter_a, RESAMPLING_ORDER, enc->resample_mem);
*a58d3d2aSXin Li        for (i=0;i<out_len;i++) out[i] = downmix[3*i];
*a58d3d2aSXin Li    } else if (enc->Fs == 12000) {
*a58d3d2aSXin Li        /* ellip(7, .2, 70, 7750/24000) */
*a58d3d2aSXin Li        static const float filter_b[8] = {-0.001017101081f,  0.003673127243f,   0.001009165267f,  0.001009165267f,  0.003673127243f, -0.001017101081f,  0.002033596776f, 0.f};
*a58d3d2aSXin Li        static const float filter_a[8] = {-4.930414411612f, 11.291643096504f, -15.322037343815f, 13.216403930898f, -7.220409219553f,  2.310550142771f, -0.334338618782f, 0.f};
*a58d3d2aSXin Li        float b0 = 0.002033596776f;
*a58d3d2aSXin Li        filter_df2t(downmix, downmix, up*in_len, b0, filter_b, filter_a, RESAMPLING_ORDER, enc->resample_mem);
*a58d3d2aSXin Li        for (i=0;i<out_len;i++) out[i] = downmix[3*i];
*a58d3d2aSXin Li    } else if (enc->Fs == 8000) {
*a58d3d2aSXin Li        /* ellip(7, .2, 70, 3900/8000) */
*a58d3d2aSXin Li        static const float filter_b[8] = { 0.081670120929f, 0.180401598565f,  0.259391051971f, 0.259391051971f,  0.180401598565f, 0.081670120929f,  0.020109185709f, 0.f};
*a58d3d2aSXin Li        static const float filter_a[8] = {-1.393651933659f, 2.609789872676f, -2.403541968806f, 2.056814957331f, -1.148908574570f, 0.473001413788f, -0.110359852412f, 0.f};
*a58d3d2aSXin Li        float b0 = 0.020109185709f;
*a58d3d2aSXin Li        filter_df2t(downmix, out, out_len, b0, filter_b, filter_a, RESAMPLING_ORDER, enc->resample_mem);
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li        celt_assert(0);
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid dred_compute_latents(DREDEnc *enc, const float *pcm, int frame_size, int extra_delay, int arch)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li    int curr_offset16k;
*a58d3d2aSXin Li    int frame_size16k = frame_size * 16000 / enc->Fs;
*a58d3d2aSXin Li    celt_assert(enc->loaded);
*a58d3d2aSXin Li    curr_offset16k = 40 + extra_delay*16000/enc->Fs - enc->input_buffer_fill;
*a58d3d2aSXin Li    enc->dred_offset = (int)floor((curr_offset16k+20.f)/40.f);
*a58d3d2aSXin Li    enc->latent_offset = 0;
*a58d3d2aSXin Li    while (frame_size16k > 0) {
*a58d3d2aSXin Li        int process_size16k;
*a58d3d2aSXin Li        int process_size;
*a58d3d2aSXin Li        process_size16k = IMIN(2*DRED_FRAME_SIZE, frame_size16k);
*a58d3d2aSXin Li        process_size = process_size16k * enc->Fs / 16000;
*a58d3d2aSXin Li        dred_convert_to_16k(enc, pcm, process_size, &enc->input_buffer[enc->input_buffer_fill], process_size16k);
*a58d3d2aSXin Li        enc->input_buffer_fill += process_size16k;
*a58d3d2aSXin Li        if (enc->input_buffer_fill >= 2*DRED_FRAME_SIZE)
*a58d3d2aSXin Li        {
*a58d3d2aSXin Li            curr_offset16k += 320;
*a58d3d2aSXin Li            dred_process_frame(enc, arch);
*a58d3d2aSXin Li            enc->input_buffer_fill -= 2*DRED_FRAME_SIZE;
*a58d3d2aSXin Li            OPUS_MOVE(&enc->input_buffer[0], &enc->input_buffer[2*DRED_FRAME_SIZE], enc->input_buffer_fill);
*a58d3d2aSXin Li            /* 15 ms (6*2.5 ms) is the ideal offset for DRED because it corresponds to our vocoder look-ahead. */
*a58d3d2aSXin Li            if (enc->dred_offset < 6) {
*a58d3d2aSXin Li                enc->dred_offset += 8;
*a58d3d2aSXin Li            } else {
*a58d3d2aSXin Li                enc->latent_offset++;
*a58d3d2aSXin Li            }
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li
*a58d3d2aSXin Li        pcm += process_size;
*a58d3d2aSXin Li        frame_size16k -= process_size16k;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic void dred_encode_latents(ec_enc *enc, const float *x, const opus_uint8 *scale, const opus_uint8 *dzone, const opus_uint8 *r, const opus_uint8 *p0, int dim, int arch) {
*a58d3d2aSXin Li    int i;
*a58d3d2aSXin Li    int q[IMAX(DRED_LATENT_DIM,DRED_STATE_DIM)];
*a58d3d2aSXin Li    float xq[IMAX(DRED_LATENT_DIM,DRED_STATE_DIM)];
*a58d3d2aSXin Li    float delta[IMAX(DRED_LATENT_DIM,DRED_STATE_DIM)];
*a58d3d2aSXin Li    float deadzone[IMAX(DRED_LATENT_DIM,DRED_STATE_DIM)];
*a58d3d2aSXin Li    float eps = .1f;
*a58d3d2aSXin Li    /* This is split into multiple loops (with temporary arrays) so that the compiler
*a58d3d2aSXin Li       can vectorize all of it, and so we can call the vector tanh(). */
*a58d3d2aSXin Li    for (i=0;i<dim;i++) {
*a58d3d2aSXin Li        delta[i] = dzone[i]*(1.f/256.f);
*a58d3d2aSXin Li        xq[i] = x[i]*scale[i]*(1.f/256.f);
*a58d3d2aSXin Li        deadzone[i] = xq[i]/(delta[i]+eps);
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    compute_activation(deadzone, deadzone, dim, ACTIVATION_TANH, arch);
*a58d3d2aSXin Li    for (i=0;i<dim;i++) {
*a58d3d2aSXin Li        xq[i] = xq[i] - delta[i]*deadzone[i];
*a58d3d2aSXin Li        q[i] = (int)floor(.5f+xq[i]);
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    for (i=0;i<dim;i++) {
*a58d3d2aSXin Li        /* Make the impossible actually impossible. */
*a58d3d2aSXin Li        if (r[i] == 0 || p0[i] == 255) q[i] = 0;
*a58d3d2aSXin Li        else ec_laplace_encode_p0(enc, q[i], p0[i]<<7, r[i]<<7);
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Listatic int dred_voice_active(const unsigned char *activity_mem, int offset) {
*a58d3d2aSXin Li    int i;
*a58d3d2aSXin Li    for (i=0;i<16;i++) {
*a58d3d2aSXin Li        if (activity_mem[8*offset + i] == 1) return 1;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    return 0;
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liint dred_encode_silk_frame(DREDEnc *enc, unsigned char *buf, int max_chunks, int max_bytes, int q0, int dQ, int qmax, unsigned char *activity_mem, int arch) {
*a58d3d2aSXin Li    ec_enc ec_encoder;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    int q_level;
*a58d3d2aSXin Li    int i;
*a58d3d2aSXin Li    int offset;
*a58d3d2aSXin Li    int ec_buffer_fill;
*a58d3d2aSXin Li    int state_qoffset;
*a58d3d2aSXin Li    ec_enc ec_bak;
*a58d3d2aSXin Li    int prev_active=0;
*a58d3d2aSXin Li    int latent_offset;
*a58d3d2aSXin Li    int extra_dred_offset=0;
*a58d3d2aSXin Li    int dred_encoded=0;
*a58d3d2aSXin Li    int delayed_dred=0;
*a58d3d2aSXin Li    int total_offset;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    latent_offset = enc->latent_offset;
*a58d3d2aSXin Li    /* Delaying new DRED data when just out of silence because we already have the
*a58d3d2aSXin Li       main Opus payload for that frame. */
*a58d3d2aSXin Li    if (activity_mem[0] && enc->last_extra_dred_offset>0) {
*a58d3d2aSXin Li        latent_offset = enc->last_extra_dred_offset;
*a58d3d2aSXin Li        delayed_dred = 1;
*a58d3d2aSXin Li        enc->last_extra_dred_offset = 0;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    while (latent_offset < enc->latents_buffer_fill && !dred_voice_active(activity_mem, latent_offset)) {
*a58d3d2aSXin Li       latent_offset++;
*a58d3d2aSXin Li       extra_dred_offset++;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    if (!delayed_dred) enc->last_extra_dred_offset = extra_dred_offset;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    /* entropy coding of state and latents */
*a58d3d2aSXin Li    ec_enc_init(&ec_encoder, buf, max_bytes);
*a58d3d2aSXin Li    ec_enc_uint(&ec_encoder, q0, 16);
*a58d3d2aSXin Li    ec_enc_uint(&ec_encoder, dQ, 8);
*a58d3d2aSXin Li    total_offset = 16 - (enc->dred_offset - extra_dred_offset*8);
*a58d3d2aSXin Li    celt_assert(total_offset>=0);
*a58d3d2aSXin Li    if (total_offset > 31) {
*a58d3d2aSXin Li       ec_enc_uint(&ec_encoder, 1, 2);
*a58d3d2aSXin Li       ec_enc_uint(&ec_encoder, total_offset>>5, 256);
*a58d3d2aSXin Li       ec_enc_uint(&ec_encoder, total_offset&31, 32);
*a58d3d2aSXin Li    } else {
*a58d3d2aSXin Li       ec_enc_uint(&ec_encoder, 0, 2);
*a58d3d2aSXin Li       ec_enc_uint(&ec_encoder, total_offset, 32);
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    celt_assert(qmax >= q0);
*a58d3d2aSXin Li    if (q0 < 14 && dQ > 0) {
*a58d3d2aSXin Li      int nvals;
*a58d3d2aSXin Li      /* If you want to use qmax == q0, you should have set dQ = 0. */
*a58d3d2aSXin Li      celt_assert(qmax > q0);
*a58d3d2aSXin Li      nvals = 15 - (q0 + 1);
*a58d3d2aSXin Li      ec_encode(&ec_encoder, qmax >= 15 ? 0 : nvals + qmax - (q0 + 1),
*a58d3d2aSXin Li        qmax >= 15 ? nvals : nvals + qmax - q0, 2*nvals);
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    state_qoffset = q0*DRED_STATE_DIM;
*a58d3d2aSXin Li    dred_encode_latents(
*a58d3d2aSXin Li        &ec_encoder,
*a58d3d2aSXin Li        &enc->state_buffer[latent_offset*DRED_STATE_DIM],
*a58d3d2aSXin Li        dred_state_quant_scales_q8 + state_qoffset,
*a58d3d2aSXin Li        dred_state_dead_zone_q8 + state_qoffset,
*a58d3d2aSXin Li        dred_state_r_q8 + state_qoffset,
*a58d3d2aSXin Li        dred_state_p0_q8 + state_qoffset,
*a58d3d2aSXin Li        DRED_STATE_DIM,
*a58d3d2aSXin Li        arch);
*a58d3d2aSXin Li    if (ec_tell(&ec_encoder) > 8*max_bytes) {
*a58d3d2aSXin Li      return 0;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    ec_bak = ec_encoder;
*a58d3d2aSXin Li    for (i = 0; i < IMIN(2*max_chunks, enc->latents_buffer_fill-latent_offset-1); i += 2)
*a58d3d2aSXin Li    {
*a58d3d2aSXin Li        int active;
*a58d3d2aSXin Li        q_level = compute_quantizer(q0, dQ, qmax, i/2);
*a58d3d2aSXin Li        offset = q_level * DRED_LATENT_DIM;
*a58d3d2aSXin Li
*a58d3d2aSXin Li        dred_encode_latents(
*a58d3d2aSXin Li            &ec_encoder,
*a58d3d2aSXin Li            enc->latents_buffer + (i+latent_offset) * DRED_LATENT_DIM,
*a58d3d2aSXin Li            dred_latent_quant_scales_q8 + offset,
*a58d3d2aSXin Li            dred_latent_dead_zone_q8 + offset,
*a58d3d2aSXin Li            dred_latent_r_q8 + offset,
*a58d3d2aSXin Li            dred_latent_p0_q8 + offset,
*a58d3d2aSXin Li            DRED_LATENT_DIM,
*a58d3d2aSXin Li            arch
*a58d3d2aSXin Li        );
*a58d3d2aSXin Li        if (ec_tell(&ec_encoder) > 8*max_bytes) {
*a58d3d2aSXin Li          /* If we haven't been able to code one chunk, give up on DRED completely. */
*a58d3d2aSXin Li          if (i==0) return 0;
*a58d3d2aSXin Li          break;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        active = dred_voice_active(activity_mem, i+latent_offset);
*a58d3d2aSXin Li        if (active || prev_active) {
*a58d3d2aSXin Li           ec_bak = ec_encoder;
*a58d3d2aSXin Li           dred_encoded = i+2;
*a58d3d2aSXin Li        }
*a58d3d2aSXin Li        prev_active = active;
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li    /* Avoid sending empty DRED packets. */
*a58d3d2aSXin Li    if (dred_encoded==0 || (dred_encoded<=2 && extra_dred_offset)) return 0;
*a58d3d2aSXin Li    ec_encoder = ec_bak;
*a58d3d2aSXin Li
*a58d3d2aSXin Li    ec_buffer_fill = (ec_tell(&ec_encoder)+7)/8;
*a58d3d2aSXin Li    ec_enc_shrink(&ec_encoder, ec_buffer_fill);
*a58d3d2aSXin Li    ec_enc_done(&ec_encoder);
*a58d3d2aSXin Li    return ec_buffer_fill;
*a58d3d2aSXin Li}