
SEGAN是一种语音增强生成对抗网络,其源码可在TensorFlow中使用。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
SEGAN是语音增强生成对抗网络项目的存储库,其中包含原始文件和测试样本。 在本研究中,我们采用了对抗性生成方法,通过一种完全卷积的体系结构来执行语音增强任务——即,从受损的语音信号中去除噪声。 具体而言,该模型处理了在不同信噪比(SNR)下的众多噪声条件下获得的原始语音波形(在训练过程中为40 dB,在测试过程中为20 dB)。 此外,该模型还能对来自同一结构中多位说话者的语音特征进行建模,且无需任何身份监督,从而赋予生成的结构在噪声和说话者维度上更强的普遍性。 该项目的所有代码均使用TensorFlow进行开发。 此外,关于生成对抗网络(GAN)的定义以及其部署方式,有两份优秀的参考资料库:GAN:提供改进以更稳定地训练G。
全部评论 (0)
还没有任何评论哟~


