
情绪分类来自音频文件:利用神经网络与多种数据集分析音频情绪
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究运用神经网络技术及多元数据集,深入剖析音频文件中的情感特征,实现对音频中情绪的有效分类。
本项目提出了一种深度学习分类器,能够预测音频文件中人类说话者的情绪状态。采用RAVDESS与TESS两个数据集对模型进行训练,在包括中立、平静、快乐、悲伤、愤怒、恐惧、厌恶及惊讶在内的8个情感类别上实现了F1分数总体为80%的成绩。
功能集信息:构建的数据集中包含5252个样本,这些样本来自RAVDESS的1440条语音文件和1012首歌曲。该数据集收录了由24位专业演员(其中女性、男性各占一半)用中性北美口音录制的两个词法匹配陈述句,并涵盖了镇定、快乐、悲伤、愤怒、恐惧及惊讶等情绪表达,另外还包含令人厌恶的情感表现。每条录音文件都经过10次评分,在情感效度、强度和真实性方面得到了评价;这些评分由247位北美成年研究参与者提供,他们都是未经训练的个体。此外还有72名参与者的重测数据也纳入了该数据集中。
全部评论 (0)
还没有任何评论哟~


