
voxseg:一个用于语音与非语音分段的Python库的VAD工具
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
VoxSeg是一款功能强大的Python库,专为语音活动检测(VAD)设计,能够精准地区分语音和非语音片段,适用于多种音频处理场景。
Voxseg 是一个用于语音活动检测(VAD)的Python软件包,旨在对音频进行语音与非语音部分的分段处理。它提供了一个完整的VAD流程,并包含预训练模型。这项工作基于以下文献:
@inproceedings{cnnbilstm_vad,
title = {A hybrid {CNN-BiLSTM} voice activity detector},
author = {Wilkinson, N. and Niesler, T.},
booktitle = {Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)},
year = {2021},
address = {Toronto, Canada}
}
全部评论 (0)
还没有任何评论哟~


