
基于PyTorch的MASR中文语音识别系统,目前采用纯CNN网络架构,并集成了三个常用的公共中文语音数据集。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
MASR中文语音识别系统,MASR 是一种以端到端深度神经网络为基础的中文普通话语音识别项目,其开发历程源于对现有技术的进一步探索。目前,该项目已进入维护休眠状态,建议用户采用性能更为优越的企业级模型以获得更佳的识别效果。关于模型原理,MASR 采用了门控卷积神经网络(Gated Convolutional Network)技术。其网络结构设计灵感来源于 Facebook 在 2016 年提出的 Wav2letter 模型,但 MASR 仅利用卷积神经网络 (CNN) 来实现语音识别功能。值得注意的是,MASR 区别于传统方法,它采用了 GLU(门控线性单元)作为激活函数,而非 ReLU 或 HardTanh 函数。正是这种差异使得 MASR 的收敛速度明显提升。为了评估模型的表现,我们采用字错误率 (Character Error Rate, CER) 作为衡量指标,CER 的计算公式为:CER = 编辑距离 / 句子长度。一个更低 CER 值意味着更高的识别准确率。在安装环境中,执行 `requirements.txt` 文件以安装必要的依赖项时,如果遇到 Pyaudio 安装错误,可以首先尝试执行 `su` 命令进行权限提升。
全部评论 (0)
还没有任何评论哟~


