
基于语音的说话者识别:利用语音MFCC及GMM进行说话人辨识
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究探讨了通过提取语音信号中的梅尔频率倒谱系数(MFCC)并结合高斯混合模型(GMM),实现有效的说话人识别技术,以区分不同说话人的身份。
基于语音的说话人识别使用免费的ST美国英语语料库数据集(SLR45)。该数据集中包含10位说话者(5名女性和5名男性)的话语,每位说话者的讲话大约有350种。
在理论上的语音特征提取中,我们采用梅尔频率倒谱系数(MFCC),因为它们在说话人验证中提供最佳结果。MFCC通常通过以下步骤得出:
1. 对信号进行傅立叶变换。
2. 使用三角形重叠窗口将获得的光谱功率映射到mel尺度上。
3. 记录每个梅尔频率下的对数功率值。
全部评论 (0)
还没有任何评论哟~


