
语音识别中的动态时间规整(DTW)Matlab代码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
语音识别中的动态时间规整(DTW)Matlab代码,由于训练或识别阶段,即使同一个人发出的同一音素,其持续时间长度也会呈现出随机变化,并且各音素的相对时长也存在随机波动。这种不确定性会导致匹配过程中,如果仅采用线性时间归整方法处理特征向量序列,那么音素识别的准确性可能会受到影响。二十世纪60年代,日本学者板仓(Itakura)提出了动态时间归整算法。该算法的核心在于通过均匀地拉伸或压缩未知量,直至其长度与参考模式一致。在进行时间归整时,未知单词的时间轴需要进行非均匀的扭曲或弯折,从而使它的特征与模型特征对齐。动态时间归整作为一种较早的技术,利用动态规划方法成功地克服了语音信号特征参数序列在比较时时长差异所带来的难题,并在孤立词语音识别任务中展现出优异的性能。
全部评论 (0)
还没有任何评论哟~


