
SpecAugment,由Google Brain提供的Pytorch实现。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
派托(Pytorch)框架为GoogleBrain的SpecAugment提供了实现,SpecAugment是一种用于自动语音识别的简便数据增强技术,被认为是该领域最先进的数据增强手段。 然而,论文作者并未公开可用的代码,他们的实现是在TensorFlow环境中完成的。 我们利用Pytorch、torchaudio以及其他工具,成功地实现了所有三个SpecAugment转换过程。 使用方法如下:首先运行install.sh脚本(建议为项目创建独立的conda环境),脚本执行完毕后,您的项目目录下应包含torchaudio文件夹。 详细功能请参考SpecAugment.ipynb(Jupyter笔记本)。此外,关于时间扭曲增强方面需要特别注意:时间扭曲增强技术依赖于TensorFlow特定的功能,而Pytorch并不支持。 为了解决此问题,我们通过SparseImageWarp.ipynb实现了相应的解决方案。
全部评论 (0)
还没有任何评论哟~


