
多峰语音情感识别:轻量级且可解释的机器学习模型,适用于语音情感识别及歧义消除(基于IEMOCAP数据集训练)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了一种针对语音情感识别的轻量级、易于解释的机器学习模型,该模型使用IEMOCAP数据集进行训练,并在减少歧义方面表现出色。
从语音中识别情感是一项具有挑战性的任务,因为情感的定义本身就比较模糊。在本项目中,我们开发了轻量级多模式机器学习模型,并将其与更复杂且难以解释的深度学习方法进行了对比研究。对于这两种类型的模型,我们都采用了基于给定音频信号的手工特征。
我们的实验表明,在IEMOCAP数据集上,轻量级模型的表现可以媲美甚至超越深度学习基准,从而实现了最先进的性能水平。我们使用了以下手工制作的特征向量来训练两种类型的数据模型:
- 基于机器学习(ML):逻辑回归、支持向量机(SVM)、随机森林、极限梯度增强和多项朴素贝叶斯。
- 基于深度学习(DL):多层感知器,长短期记忆(LSTM)分类器。
本项目是滑铁卢大学CS 698课程——计算音频的一个学期作业。所有实验均使用了特定的软件库进行了测试。
全部评论 (0)
还没有任何评论哟~


