
基于语音的性别识别研究:利用MFCC与GMM的方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究探讨了通过提取音频信号中的梅尔频率倒谱系数(MFCC)并结合高斯混合模型(GMM)进行性别分类的有效性,为语音处理领域提供了一种新的分析手段。
基于语音的性别识别使用免费的ST美国英语语料库数据集(SLR45)。该数据集中包含10位说话者(5位女性和5位男性)的讲话,每位说话者的录音大约有350句。
在理论声学特征提取中,我们选用梅尔频率倒谱系数(MFCC),因为它们在说话人验证中表现出色。具体步骤如下:
- 对信号进行傅立叶变换。
- 使用三角形重叠窗口将上述光谱的功率映射到Mel尺度上。
- 记录每个Mel频率下的对数功率值。
这些特征被用于构建高斯混合模型(GMM)以实现性别识别任务。
全部评论 (0)
还没有任何评论哟~


