asrt语音开发Android,GitHub - Rock15030110082/ASRT_SpeechRecognition: 基于深度学习的语音识别系统，使用CNN、LSTM和CTC实现的中文语音...

卫嘉佑

2023-12-01

ASRT_SpeechRecognition

基于深度学习的语音识别系统

Introduction 简介

本项目使用Keras、TensorFlow基于长短时记忆神经网络和卷积神经网络以及CTC进行制作。

This project uses keras, TensorFlow based on LSTM, CNN and CTC to implement.

本项目目前已经可以正常进行训练了。

通过git克隆仓库以后，需要将datalist目录下的文件全部拷贝到dataset目录下，也就是将其跟数据集放在一起。

目前可用的模型有22

本项目运行请执行：

$ python3 SpeechModel22.py

Model 模型

Speech Model 语音模型

CNN + LSTM/GRU + CTC

Language Model 语言模型

基于概率图的马尔可夫模型

Python Import

Python的依赖库

python_speech_features

TensorFlow

Keras

Numpy

wave

matplotlib

math

Scipy

h5py

Data Sets 数据集

清华大学THCHS30中文语音数据集

Free ST Chinese Mandarin Corpus

特别鸣谢！感谢前辈们的公开语音数据集

Log

日志