rnnoise/src/rnn.c

*1295d682SXin Li/* Copyright (c) 2008-2011 Octasic Inc.
*1295d682SXin Li                 2012-2017 Jean-Marc Valin */
*1295d682SXin Li/*
*1295d682SXin Li   Redistribution and use in source and binary forms, with or without
*1295d682SXin Li   modification, are permitted provided that the following conditions
*1295d682SXin Li   are met:
*1295d682SXin Li
*1295d682SXin Li   - Redistributions of source code must retain the above copyright
*1295d682SXin Li   notice, this list of conditions and the following disclaimer.
*1295d682SXin Li
*1295d682SXin Li   - Redistributions in binary form must reproduce the above copyright
*1295d682SXin Li   notice, this list of conditions and the following disclaimer in the
*1295d682SXin Li   documentation and/or other materials provided with the distribution.
*1295d682SXin Li
*1295d682SXin Li   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
*1295d682SXin Li   ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
*1295d682SXin Li   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
*1295d682SXin Li   A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
*1295d682SXin Li   CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
*1295d682SXin Li   EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
*1295d682SXin Li   PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
*1295d682SXin Li   PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
*1295d682SXin Li   LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
*1295d682SXin Li   NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
*1295d682SXin Li   SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
*1295d682SXin Li*/
*1295d682SXin Li
*1295d682SXin Li#ifdef HAVE_CONFIG_H
*1295d682SXin Li#include "config.h"
*1295d682SXin Li#endif
*1295d682SXin Li
*1295d682SXin Li#include <math.h>
*1295d682SXin Li#include "opus_types.h"
*1295d682SXin Li#include "common.h"
*1295d682SXin Li#include "arch.h"
*1295d682SXin Li#include "tansig_table.h"
*1295d682SXin Li#include "rnn.h"
*1295d682SXin Li#include "rnn_data.h"
*1295d682SXin Li#include <stdio.h>
*1295d682SXin Li
*1295d682SXin Listatic OPUS_INLINE float tansig_approx(float x)
*1295d682SXin Li{
*1295d682SXin Li    int i;
*1295d682SXin Li    float y, dy;
*1295d682SXin Li    float sign=1;
*1295d682SXin Li    /* Tests are reversed to catch NaNs */
*1295d682SXin Li    if (!(x<8))
*1295d682SXin Li        return 1;
*1295d682SXin Li    if (!(x>-8))
*1295d682SXin Li        return -1;
*1295d682SXin Li#ifndef FIXED_POINT
*1295d682SXin Li    /* Another check in case of -ffast-math */
*1295d682SXin Li    if (celt_isnan(x))
*1295d682SXin Li       return 0;
*1295d682SXin Li#endif
*1295d682SXin Li    if (x<0)
*1295d682SXin Li    {
*1295d682SXin Li       x=-x;
*1295d682SXin Li       sign=-1;
*1295d682SXin Li    }
*1295d682SXin Li    i = (int)floor(.5f+25*x);
*1295d682SXin Li    x -= .04f*i;
*1295d682SXin Li    y = tansig_table[i];
*1295d682SXin Li    dy = 1-y*y;
*1295d682SXin Li    y = y + x*dy*(1 - y*x);
*1295d682SXin Li    return sign*y;
*1295d682SXin Li}
*1295d682SXin Li
*1295d682SXin Listatic OPUS_INLINE float sigmoid_approx(float x)
*1295d682SXin Li{
*1295d682SXin Li   return .5 + .5*tansig_approx(.5*x);
*1295d682SXin Li}
*1295d682SXin Li
*1295d682SXin Listatic OPUS_INLINE float relu(float x)
*1295d682SXin Li{
*1295d682SXin Li   return x < 0 ? 0 : x;
*1295d682SXin Li}
*1295d682SXin Li
*1295d682SXin Livoid compute_dense(const DenseLayer *layer, float *output, const float *input)
*1295d682SXin Li{
*1295d682SXin Li   int i, j;
*1295d682SXin Li   int N, M;
*1295d682SXin Li   int stride;
*1295d682SXin Li   M = layer->nb_inputs;
*1295d682SXin Li   N = layer->nb_neurons;
*1295d682SXin Li   stride = N;
*1295d682SXin Li   for (i=0;i<N;i++)
*1295d682SXin Li   {
*1295d682SXin Li      /* Compute update gate. */
*1295d682SXin Li      float sum = layer->bias[i];
*1295d682SXin Li      for (j=0;j<M;j++)
*1295d682SXin Li         sum += layer->input_weights[j*stride + i]*input[j];
*1295d682SXin Li      output[i] = WEIGHTS_SCALE*sum;
*1295d682SXin Li   }
*1295d682SXin Li   if (layer->activation == ACTIVATION_SIGMOID) {
*1295d682SXin Li      for (i=0;i<N;i++)
*1295d682SXin Li         output[i] = sigmoid_approx(output[i]);
*1295d682SXin Li   } else if (layer->activation == ACTIVATION_TANH) {
*1295d682SXin Li      for (i=0;i<N;i++)
*1295d682SXin Li         output[i] = tansig_approx(output[i]);
*1295d682SXin Li   } else if (layer->activation == ACTIVATION_RELU) {
*1295d682SXin Li      for (i=0;i<N;i++)
*1295d682SXin Li         output[i] = relu(output[i]);
*1295d682SXin Li   } else {
*1295d682SXin Li     *(int*)0=0;
*1295d682SXin Li   }
*1295d682SXin Li}
*1295d682SXin Li
*1295d682SXin Livoid compute_gru(const GRULayer *gru, float *state, const float *input)
*1295d682SXin Li{
*1295d682SXin Li   int i, j;
*1295d682SXin Li   int N, M;
*1295d682SXin Li   int stride;
*1295d682SXin Li   float z[MAX_NEURONS];
*1295d682SXin Li   float r[MAX_NEURONS];
*1295d682SXin Li   float h[MAX_NEURONS];
*1295d682SXin Li   M = gru->nb_inputs;
*1295d682SXin Li   N = gru->nb_neurons;
*1295d682SXin Li   stride = 3*N;
*1295d682SXin Li   for (i=0;i<N;i++)
*1295d682SXin Li   {
*1295d682SXin Li      /* Compute update gate. */
*1295d682SXin Li      float sum = gru->bias[i];
*1295d682SXin Li      for (j=0;j<M;j++)
*1295d682SXin Li         sum += gru->input_weights[j*stride + i]*input[j];
*1295d682SXin Li      for (j=0;j<N;j++)
*1295d682SXin Li         sum += gru->recurrent_weights[j*stride + i]*state[j];
*1295d682SXin Li      z[i] = sigmoid_approx(WEIGHTS_SCALE*sum);
*1295d682SXin Li   }
*1295d682SXin Li   for (i=0;i<N;i++)
*1295d682SXin Li   {
*1295d682SXin Li      /* Compute reset gate. */
*1295d682SXin Li      float sum = gru->bias[N + i];
*1295d682SXin Li      for (j=0;j<M;j++)
*1295d682SXin Li         sum += gru->input_weights[N + j*stride + i]*input[j];
*1295d682SXin Li      for (j=0;j<N;j++)
*1295d682SXin Li         sum += gru->recurrent_weights[N + j*stride + i]*state[j];
*1295d682SXin Li      r[i] = sigmoid_approx(WEIGHTS_SCALE*sum);
*1295d682SXin Li   }
*1295d682SXin Li   for (i=0;i<N;i++)
*1295d682SXin Li   {
*1295d682SXin Li      /* Compute output. */
*1295d682SXin Li      float sum = gru->bias[2*N + i];
*1295d682SXin Li      for (j=0;j<M;j++)
*1295d682SXin Li         sum += gru->input_weights[2*N + j*stride + i]*input[j];
*1295d682SXin Li      for (j=0;j<N;j++)
*1295d682SXin Li         sum += gru->recurrent_weights[2*N + j*stride + i]*state[j]*r[j];
*1295d682SXin Li      if (gru->activation == ACTIVATION_SIGMOID) sum = sigmoid_approx(WEIGHTS_SCALE*sum);
*1295d682SXin Li      else if (gru->activation == ACTIVATION_TANH) sum = tansig_approx(WEIGHTS_SCALE*sum);
*1295d682SXin Li      else if (gru->activation == ACTIVATION_RELU) sum = relu(WEIGHTS_SCALE*sum);
*1295d682SXin Li      else *(int*)0=0;
*1295d682SXin Li      h[i] = z[i]*state[i] + (1-z[i])*sum;
*1295d682SXin Li   }
*1295d682SXin Li   for (i=0;i<N;i++)
*1295d682SXin Li      state[i] = h[i];
*1295d682SXin Li}
*1295d682SXin Li
*1295d682SXin Li#define INPUT_SIZE 42
*1295d682SXin Li
*1295d682SXin Livoid compute_rnn(RNNState *rnn, float *gains, float *vad, const float *input) {
*1295d682SXin Li  int i;
*1295d682SXin Li  float dense_out[MAX_NEURONS];
*1295d682SXin Li  float noise_input[MAX_NEURONS*3];
*1295d682SXin Li  float denoise_input[MAX_NEURONS*3];
*1295d682SXin Li  compute_dense(rnn->model->input_dense, dense_out, input);
*1295d682SXin Li  compute_gru(rnn->model->vad_gru, rnn->vad_gru_state, dense_out);
*1295d682SXin Li  compute_dense(rnn->model->vad_output, vad, rnn->vad_gru_state);
*1295d682SXin Li  for (i=0;i<rnn->model->input_dense_size;i++) noise_input[i] = dense_out[i];
*1295d682SXin Li  for (i=0;i<rnn->model->vad_gru_size;i++) noise_input[i+rnn->model->input_dense_size] = rnn->vad_gru_state[i];
*1295d682SXin Li  for (i=0;i<INPUT_SIZE;i++) noise_input[i+rnn->model->input_dense_size+rnn->model->vad_gru_size] = input[i];
*1295d682SXin Li  compute_gru(rnn->model->noise_gru, rnn->noise_gru_state, noise_input);
*1295d682SXin Li
*1295d682SXin Li  for (i=0;i<rnn->model->vad_gru_size;i++) denoise_input[i] = rnn->vad_gru_state[i];
*1295d682SXin Li  for (i=0;i<rnn->model->noise_gru_size;i++) denoise_input[i+rnn->model->vad_gru_size] = rnn->noise_gru_state[i];
*1295d682SXin Li  for (i=0;i<INPUT_SIZE;i++) denoise_input[i+rnn->model->vad_gru_size+rnn->model->noise_gru_size] = input[i];
*1295d682SXin Li  compute_gru(rnn->model->denoise_gru, rnn->denoise_gru_state, denoise_input);
*1295d682SXin Li  compute_dense(rnn->model->denoise_output, gains, rnn->denoise_gru_state);
*1295d682SXin Li}