
基于Python、WaveNet、CTC和TensorFlow的智能语音识别及方言分类深度学习算法研究与实现-附完整工程源码及训练数据集
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目采用Python结合WaveNet和CTC技术,利用TensorFlow框架进行深度学习,致力于开发高效的智能语音识别系统,并能有效区分不同方言。项目包含完整的代码库及训练所需的数据集。
本项目通过调取语音文件与标注文件提取梅尔倒谱系数特征,并进行归一化处理。根据标注文件建立字典后选择WaveNet机器学习模型训练,在完成softmax处理之后保存模型。
项目的运行环境包括Python及Tensorflow,需要安装Keras 2.2.0和TensorFlow1.9版本。
项目分为三个模块:方言分类、语音识别以及模型测试。数据集由科大讯飞提供,包含长沙话、上海话和南昌话三种方言的50至300KB大小不等的语音文件共19489条记录。我们分别构建了用于方言分类与语音识别训练的模型,并开发了一个图形用户界面。
在测试阶段,在训练集上进行的方言分类准确率超过了98%。项目还能够实现语音识别及方言分类功能。
全部评论 (0)
还没有任何评论哟~


