
Kaldi-GOP:计算基于高斯混合模型(GMM)的发音质量(GOP)。 基于Kaldi-源码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
该项目利用Kaldi工具,构建基于高斯混合模型(GMM)的GOP(发音优度)系统。
关于基于深度神经网络(DNN)实现的详细信息,请参阅Kaldi官方存储库。
GOP-DNN的性能预计将远优于GOP-GMM。
构建步骤如下:
首先,执行命令 `./build.sh`。
接下来,运行示例程序,请切换到 `egs/gop-compute` 目录并执行 `./run.sh` 命令。
理论基础:
在传统的基于GMM-HMM的语音识别系统中,GOP最初由Witt等人(2000)提出。它被定义为对后验持续时间进行标准化后的对数概率:
$$ GOP(p) = \frac{1}{t_e - t_s + 1} \log p(p | \mathbf{o}) $$
其中,$ \mathbf{o}$ 代表输入观测值,$ p$ 表示规范电话,$ t_s$ 和 $t_e$ 分别是开始和结束帧的索引。
此外,对于任意两个音素 $q_i$ 和 $q_j$,我们假设 $p(q_i) p(q_j)$ 满足以下关系:
全部评论 (0)
还没有任何评论哟~


