torch/rdovae/README.md

*a58d3d2aSXin Li# Rate-Distortion-Optimized Variational Auto-Encoder
*a58d3d2aSXin Li
*a58d3d2aSXin Li## Setup
*a58d3d2aSXin LiThe python code requires python >= 3.6 and has been tested with python 3.6 and python 3.10. To install requirements run
*a58d3d2aSXin Li```
*a58d3d2aSXin Lipython -m pip install -r requirements.txt
*a58d3d2aSXin Li```
*a58d3d2aSXin Li
*a58d3d2aSXin Li## Training
*a58d3d2aSXin LiTo generate training data use dump date from the main LPCNet repo
*a58d3d2aSXin Li```
*a58d3d2aSXin Li./dump_data -train 16khz_speech_input.s16 features.f32 data.s16
*a58d3d2aSXin Li```
*a58d3d2aSXin Li
*a58d3d2aSXin LiTo train the model, simply run
*a58d3d2aSXin Li```
*a58d3d2aSXin Lipython train_rdovae.py features.f32 output_folder
*a58d3d2aSXin Li```
*a58d3d2aSXin Li
*a58d3d2aSXin LiTo train on CUDA device add `--cuda-visible-devices idx`.
*a58d3d2aSXin Li
*a58d3d2aSXin Li
*a58d3d2aSXin Li## ToDo
*a58d3d2aSXin Li- Upload checkpoints and add URLs