libopus/dnn/pitchdnn.c

*a58d3d2aSXin Li#ifdef HAVE_CONFIG_H
*a58d3d2aSXin Li#include "config.h"
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li
*a58d3d2aSXin Li#include <math.h>
*a58d3d2aSXin Li#include "pitchdnn.h"
*a58d3d2aSXin Li#include "os_support.h"
*a58d3d2aSXin Li#include "nnet.h"
*a58d3d2aSXin Li#include "lpcnet_private.h"
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Lifloat compute_pitchdnn(
*a58d3d2aSXin Li    PitchDNNState *st,
*a58d3d2aSXin Li    const float *if_features,
*a58d3d2aSXin Li    const float *xcorr_features,
*a58d3d2aSXin Li    int arch
*a58d3d2aSXin Li    )
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  float if1_out[DENSE_IF_UPSAMPLER_1_OUT_SIZE];
*a58d3d2aSXin Li  float downsampler_in[NB_XCORR_FEATURES + DENSE_IF_UPSAMPLER_2_OUT_SIZE];
*a58d3d2aSXin Li  float downsampler_out[DENSE_DOWNSAMPLER_OUT_SIZE];
*a58d3d2aSXin Li  float conv1_tmp1[(NB_XCORR_FEATURES + 2)*8] = {0};
*a58d3d2aSXin Li  float conv1_tmp2[(NB_XCORR_FEATURES + 2)*8] = {0};
*a58d3d2aSXin Li  float output[DENSE_FINAL_UPSAMPLER_OUT_SIZE];
*a58d3d2aSXin Li  int i;
*a58d3d2aSXin Li  int pos=0;
*a58d3d2aSXin Li  float maxval=-1;
*a58d3d2aSXin Li  float sum=0;
*a58d3d2aSXin Li  float count=0;
*a58d3d2aSXin Li  PitchDNN *model = &st->model;
*a58d3d2aSXin Li  /* IF */
*a58d3d2aSXin Li  compute_generic_dense(&model->dense_if_upsampler_1, if1_out, if_features, ACTIVATION_TANH, arch);
*a58d3d2aSXin Li  compute_generic_dense(&model->dense_if_upsampler_2, &downsampler_in[NB_XCORR_FEATURES], if1_out, ACTIVATION_TANH, arch);
*a58d3d2aSXin Li  /* xcorr*/
*a58d3d2aSXin Li  OPUS_COPY(&conv1_tmp1[1], xcorr_features, NB_XCORR_FEATURES);
*a58d3d2aSXin Li  compute_conv2d(&model->conv2d_1, &conv1_tmp2[1], st->xcorr_mem1, conv1_tmp1, NB_XCORR_FEATURES, NB_XCORR_FEATURES+2, ACTIVATION_TANH, arch);
*a58d3d2aSXin Li  compute_conv2d(&model->conv2d_2, downsampler_in, st->xcorr_mem2, conv1_tmp2, NB_XCORR_FEATURES, NB_XCORR_FEATURES, ACTIVATION_TANH, arch);
*a58d3d2aSXin Li
*a58d3d2aSXin Li  compute_generic_dense(&model->dense_downsampler, downsampler_out, downsampler_in, ACTIVATION_TANH, arch);
*a58d3d2aSXin Li  compute_generic_gru(&model->gru_1_input, &model->gru_1_recurrent, st->gru_state, downsampler_out, arch);
*a58d3d2aSXin Li  compute_generic_dense(&model->dense_final_upsampler, output, st->gru_state, ACTIVATION_LINEAR, arch);
*a58d3d2aSXin Li  for (i=0;i<180;i++) {
*a58d3d2aSXin Li    if (output[i] > maxval) {
*a58d3d2aSXin Li      pos = i;
*a58d3d2aSXin Li      maxval = output[i];
*a58d3d2aSXin Li    }
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li  for (i=IMAX(0, pos-2); i<=IMIN(179, pos+2); i++) {
*a58d3d2aSXin Li    float p = exp(output[i]);
*a58d3d2aSXin Li    sum += p*i;
*a58d3d2aSXin Li    count += p;
*a58d3d2aSXin Li  }
*a58d3d2aSXin Li  /*printf("%d %f\n", pos, sum/count);*/
*a58d3d2aSXin Li  return (1.f/60.f)*(sum/count) - 1.5;
*a58d3d2aSXin Li  /*return 256.f/pow(2.f, (1.f/60.f)*i);*/
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Livoid pitchdnn_init(PitchDNNState *st)
*a58d3d2aSXin Li{
*a58d3d2aSXin Li  int ret;
*a58d3d2aSXin Li  OPUS_CLEAR(st, 1);
*a58d3d2aSXin Li#ifndef USE_WEIGHTS_FILE
*a58d3d2aSXin Li  ret = init_pitchdnn(&st->model, pitchdnn_arrays);
*a58d3d2aSXin Li#else
*a58d3d2aSXin Li  ret = 0;
*a58d3d2aSXin Li#endif
*a58d3d2aSXin Li  celt_assert(ret == 0);
*a58d3d2aSXin Li}
*a58d3d2aSXin Li
*a58d3d2aSXin Liint pitchdnn_load_model(PitchDNNState *st, const void *data, int len) {
*a58d3d2aSXin Li  WeightArray *list;
*a58d3d2aSXin Li  int ret;
*a58d3d2aSXin Li  parse_weights(&list, data, len);
*a58d3d2aSXin Li  ret = init_pitchdnn(&st->model, list);
*a58d3d2aSXin Li  opus_free(list);
*a58d3d2aSXin Li  if (ret == 0) return 0;
*a58d3d2aSXin Li  else return -1;
*a58d3d2aSXin Li}