1.先将代码下载到服务器,并安装
git clone https://github.com/mozilla/TTS
pip install -e .
注:
pip install e . 与setup.py关系:
Editable—pip-----------------setup.py
yes---------pip install -e . —python setup.py develop
no----------pip install . ------ python setup.py install
一般建议使用pip有一系列原因:
在您的情况下,我非常怀疑您的包具有依赖关系,如果您使用pip则会自动安装,但如果您使用python setup.py install则不会.
2.cd data2/zhoujie/ 进入自己文件夹下
cd data2/zhoujie/
cd TTS/
mkdir data
建立新文件夹data用来存放数据,
cd data
mv data/ ./
把培姐目录下的BIAOBEI数据移动到我当前目录biaobei_48000
3.看采样率,发现采样率为48000,需批量降采样到22050.
sox --i 008892.wav
新建文件夹biaobei_22050
用一个shell脚本:
for i in /data2/zhoujie/TTS/data/BIAOBEI/biaobei_48000/*.wav
do
echo $i
sox $i -r 22050 /data2/zhoujie/TTS/data/BIAOBEI/biaobei_22050/${i##*/}
done
注:
运行.sh以下三种一样:
./home/hello.sh
/home/hello.sh
sh /home/hello.sh
4.修改配置文件multiband_melgan_config.json参数:
修改//DATASET里,数据存放路径:
“data_path”:"/data2/zhoujie/TTS/data/BIAOBEI/biaobei_22050/"
修改//PATHS里,模型输出结果路径:
“output_path”:"/data2/zhoujie/TTS/Models/BIAOBEI/"
修改//Normalization parameters里路径:
“stats_path”:"/data2/zhoujie/TTS/data/BIAOBEI/scale_stats.npy"
5.在/data2/zhoujie/TTS/下运行
可先nvidia-smi查看哪号GPU空闲
CUDA_VISIBLE_DEVICES='0'
python3 TTS/bin/train_vocoder_gan.py --config_path
/data2/zhoujie/TTS/TTS/vocoder/configs/multiband_melgan_config.json
若中断,想接着原来继续训练:
CUDA_VISIBLE_DEVICES='0'
python3 TTS/bin/train_vocoder_gan.py --continue_path
/data2/zhoujie/TTS/Models/BIAOBEI/multiband-melgan-June-11-2021_02+41AM-e9e0784
6.此时报错没有scale_stats.npy。
python TTS/bin/compute_statistics.py --config_path path/to/config.json
查看该代码main,发现需要–config_path和–out_path。
运行compute_statistics.py:
python3
TTS/bin/compute_statistics.py --config_path
TTS/vocoder/configs/multiband_melgan_config.json --out_path
/data2/zhoujie/TTS/data/BIAOBEI/
报错语法错误,改成python3;
报错no such direction,路径不对,删掉config_path中TTS/TTS/vocoder/configs/multiband_melgan_config.json的一个TTS;
报错没有scale_stats.npy。np.save是具体到文件名,如果没后缀会自动加,保存路径–out_path
/data2/zhoujie/TTS/data/BIAOBEI/scale_stats.npy)