ASRT_SpeechRecognition
基于深度学习的语音识别系统
Introduction 简介
本项目使用Keras、TensorFlow基于长短时记忆神经网络和卷积神经网络以及CTC进行制作。
This project uses keras, TensorFlow based on LSTM, CNN and CTC to implement.
本项目目前已经可以正常进行训练了。
通过git克隆仓库以后,需要将datalist目录下的文件全部拷贝到dataset目录下,也就是将其跟数据集放在一起。
目前可用的模型有22
本项目运行请执行:
$ python3 SpeechModel22.py
Model 模型
Speech Model 语音模型
CNN + LSTM/GRU + CTC
Language Model 语言模型
基于概率图的马尔可夫模型
Python Import
Python的依赖库
python_speech_features
TensorFlow
Keras
Numpy
wave
matplotlib
math
Scipy
h5py
Data Sets 数据集
清华大学THCHS30中文语音数据集
Free ST Chinese Mandarin Corpus
特别鸣谢!感谢前辈们的公开语音数据集
Log
日志