
基于LPC、LPCC和PLP的孤立词语音识别对比研究及模型阶次影响分析...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究针对孤立词语音识别问题,比较了LPC(线性预测编码)、LPCC(线性预测 cepstral系数)和PLP(Perceptual Linear Prediction感知线性预测)三种特征参数的性能,并深入探讨了模型阶次对识别率的影响。
机器的自动语音识别(ASR)研究已经超过六十年了。尽管取得了许多进步,在准确性和速度方面,机器仍然无法与人类对手相匹敌,尤其是在说话者独立的情况下进行语音识别时更是如此。因此,当今的研究重点之一就是解决这种说话者独立的问题,并且在对信号特征向量的提取之前需要执行语音处理步骤,这表明前端分析的重要性。
这项研究的目标是探讨、实施和比较广泛应用于语音识别中的参数化方法,包括线性预测编码(LPC)、线性预测倒谱系数(LPCC)以及感知线性预测(PLP)。我们还将观察模型参数变化对识别率的影响。使用矢量量化(VQ)来准备每个话语的单词模板,并利用欧几里得距离作为分类器。
在实验中,采用了TI-46的文字数据库来比较不同前端处理方法的效果,包括干净环境下的语音和因噪声及频谱变异而降低质量的语音。研究了从40dB到-5dB的各种信噪比(SNR)级别下语音识别的表现,并使用高斯白噪声进行实验。
观察结果表明,在干净以及嘈杂环境中,LPCC方法都优于LPC;同时带有DELTA和DELTA-DELTA处理后的PLP在所有环境中的表现均超过了LPC与LPCC。本段落对以上所述的各个技术进行了比较分析,并讨论了每种技术在不同条件下的适用性。
全部评论 (0)
还没有任何评论哟~


