
UrbanSound8K音频分类_ResNet源码
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目基于ResNet架构实现UrbanSound8K数据集的音频分类任务,旨在提高城市环境声音识别准确率。代码开源可应用于智能监控与辅助听力系统中。
该项目的目标是使用ResNet-18架构对UrbanSound8K数据集中的环境声音进行分类,并且也利用Google的语音命令数据集进行同样的分类工作。
对于URBANSOUND8K数据集,我们采用了两种不同的方法:
**方法一:**
这是标准的train-dev-test拆分方式。在所有8732个数据点中,按照大约60-20-20的比例分配为训练、验证和测试部分。
1. 测试准确度:77.61%
这是使用标准分割方法报告的最佳测试准确性结果。
2. 训练准确率:100%
3. 验证准确性:77.26%
**方法二:**
这是数据集创建者推荐的评估方案,即进行10倍交叉验证。在这个过程中,每个折叠中的所有数据都用于训练和验证阶段。在每一时期结束时获取并计算了平均值,包括验证准确性和训练损失等指标。
这两种方法能够有效地评估ResNet-18架构在环境声音分类任务上的性能表现。
全部评论 (0)
还没有任何评论哟~


