
语音情感识别:利用基于IEMOCAP数据集的卷积递归网络技术
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究探讨了使用卷积递归神经网络对IEMOCAP数据库中的语音情感进行识别的技术方法,旨在提升语音情感分析的准确性。
我们使用TensorFlow在IEMOCAP数据库上实现了基于卷积递归神经网络的语音情感识别(SER)。为了解决帧情感标签不确定性的问题,采用了三种合并策略:最大合并、均值合并以及基于注意力机制的加权池化来生成发声级功能。这些代码曾在配备GTX-1080 GPU的ubuntu 16.04 (x64)系统上进行测试,并使用了python2.7、cuda-8.0和cudnn-6.0。
要在计算机上运行这些代码,您需要安装以下依赖项:
张量流(TensorFlow)版本1.3.0
python_speech_features库
波(cPickle)
麻木(sklern)操作系统演示版
要开始使用,请先分叉存储库。
全部评论 (0)
还没有任何评论哟~


