
Speech Recognition via CNN: Isolated Word Speech Recognition for the Digital Signal Processing Final Project at Fudan Universitys School of Computer Science and Technology
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目是复旦大学计算机科学技术学院数字信号处理课程的期末作业,旨在通过卷积神经网络(CNN)实现孤立词语音识别系统。
语音识别通过CNN孤立词语音识别技术实现了一个强大的系统,能够辨识20个单独的单词,例如“语音”,“北京”,“文件”等。该系统利用从原始音频中提取的梅尔频谱特征,并将这些频谱视作图像数据,运用卷积神经网络进行分类处理。
要运行此项目,请确保您的环境中安装了支持CUDA(因为推理过程需要GPU)和flask的pytorch版本大于等于0.4。强烈建议使用Anaconda来设置环境。
完成环境配置后,在命令行中输入“python audio_server.py”即可启动语音识别服务。这将使Web服务在端口22339上运行,您可以通过localhost:22339访问该服务,并通过点击按钮发送您的声音进行测试。
全部评论 (0)
还没有任何评论哟~


