
DFT的MATLAB源代码(ASR):应用于自动语音识别(ASR)中的梅尔频率倒谱系数(MFCC)和动态时间规整(DTW)算法的Python...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
DFT的MATLAB源代码,用于实现梅尔频率倒谱系数(MFCC)和动态时间规整(DTW)算法的自动语音识别(ASR)流程,具体包括对.wav文件中的音频数据和采样频率帧信号的处理。该方法首先应用汉明窗口函数对框架进行分析,进而计算每个DFT仓的周期图、功率谱密度,并进行梅尔频率滤波器组的信号处理,通过对每个滤波器内的能量求和以及以10为底的对数取值来计算DCT系数。此外,该方法还保留系数[1:13],并利用参考向量和输入向量计算DTW的最佳路径及欧式距离。为了进行噪音门预加重/提升,该程序还会估计特征向量数据库中的音频记录/播放(通过audio.py实现),并且尝试将MFCC提取程序封装成类。
全部评论 (0)
还没有任何评论哟~


