
情感识别音频信号:利用OpenSmile、PCA及Scikit-...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文探讨了通过OpenSmile工具提取音频特征,并结合主成分分析(PCA)和机器学习库Scikit-learn进行降维与分类,实现对情感的有效识别。
使用OpenSmile库从SAVEE数据库中的音频信号进行情感识别是一项有启发性的研究工作。SAVEE数据库由萨里大学的四名以英语为母语的男性说话者(分别为DC、JE、JK、KL)录制,包括7种不同情绪和480个英国英语发音。OpenSmile用于从.wav文件中提取特征,并生成1582个特征。之后采用主成分分析方法减少维度,最后使用了不同的算法进行分类。
这些情感类别分别是:愤怒、厌恶、恐惧、快乐、悲伤、惊讶以及中立情绪。
使用的多层感知器分类器和Logistic回归+ lbfgs解算器的模型表现分别为0.8021(四舍五入到小数点后六位)。
全部评论 (0)
还没有任何评论哟~


