
基于CNN的连续语音说话人识别研究
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本研究探讨了利用卷积神经网络(CNN)进行连续语音说话人识别的有效性,通过分析不同架构对性能的影响,提出了一种优化模型以提高识别准确率。
近年来,随着社会生活水平的提高,人们对机器智能人声识别的要求也越来越高。在说话人识别研究领域中,高斯混合—隐马尔可夫模型(GMM-HMM)是最为重要的模型之一。然而由于该模型对大量语音数据建模的能力较差,并且对于噪声环境下的适应性不强,其发展遇到了瓶颈。
为了克服这些问题,研究人员开始转向深度学习技术的研究应用。他们引入了卷积神经网络(CNN)来解决连续语音说话人识别的问题,并提出了CSR-CNN算法。这种算法通过提取固定长度、符合语序的语音片段,在时间线上形成有序的语谱图;然后利用CNN模型从这些数据中抽取特征序列,再经过奖惩函数对所得到的不同组合进行评估和优化。
实验结果显示,相较于传统的GMM-HMM方法,CSR-CNN在连续—片段说话人识别任务上取得了更佳的效果。
全部评论 (0)
还没有任何评论哟~


