
Denoiser: 实时语音增强在波形域的应用(Interspeech 2020)我们提供了论文《波形域中的实时语音增强》的PyTorch...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了实时语音增强技术在波形域的应用,提出了基于Pytorch框架的Denoiser模型,在Interspeech 2020会议上发表。
本段落介绍了一种在Interspeech 2020会议上提出的实时语音增强方法的实现。我们提出了一种因果性语音增强模型,可以在便携式计算机CPU上进行原始波形处理,并实现实时运行。
该模型基于具有跳过连接的编码器-解码器架构设计而成。通过使用多个损失函数,在时间域和频率域对其进行优化,可以有效消除各种背景噪音(包括固定与非固定的环境噪声以及房间混响)。此外,我们还提出了一种直接在原始波形上应用数据增强技术的方法,以进一步提高模型性能及泛化能力。
安装步骤如下:首先,请确保您已经安装了Python 3.7版本(推荐使用Anaconda);接着根据您的需求选择相应的操作方式。如果您仅想利用预训练的模型进行测试,则可以通过pip命令快速完成依赖项安装;而如果需要对模型进行培训或学习,建议先克隆此存储库并按照说明安装相关依赖环境。我们还建议在全新的virtualenv中运行以避免潜在冲突问题。
全部评论 (0)
还没有任何评论哟~


