
声音分类_UrbanSound-Classification:基于神经网络的方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目运用深度学习技术,专注于城市环境下的声音分类问题,通过构建高效神经网络模型,实现对复杂音频数据的精准分析与识别。
数据集8732标记了以下10类城市声音的声音摘录(≤ 4秒):空调、汽车喇叭声、儿童游戏、狗叫声、钻探噪音、引擎怠速运转声音、枪响、手提凿岩机工作声、警笛声和街头音乐。使用开源库完成特征提取,其中Librosa允许加载音频文件,提取特征并生成波形图等操作。我们将研究标准的多感知器模型以及卷积网络和递归网络,并采用一个提供高级神经网络API的技术栈来实现这些模型。
未来计划尝试的时间卷积网络(TCN)基于因果卷积概念构建。因果仅表示在时间步t处的过滤器只能看到不迟于t的输入信息。使用膨胀卷积的目的在于以更少的参数和层获取更大的接收场,从而提高效率。TCN还采用残差块设计:将两个膨胀卷积层堆叠在一起,并把最终卷积的结果加回到输入中得到该块输出。
要求如下:
- librosa == 0.6.0
- pandas==0.20.3
- keras==2
全部评论 (0)
还没有任何评论哟~


