
视听语音数据集 (AVSpeech) .torrent
5星
- 浏览量: 0
- 大小:None
- 文件类型:TORRENT
简介:
AVSpeech数据集是一个包含大量多模态内容的大型资源库,它整合了视频、音频和文本信息,为研究人员提供了丰富的材料用于进行多媒体分析与理解的研究。
AVSpeech是一个新的大规模视听数据集,包含无背景噪声干扰的语音视频剪辑。每个片段长3到10秒,并且可以看到说话人的面部。整个数据集中有大约4700个小时的视频片段,这些视频来自YouTube上的29万个不同来源,涵盖了各种人、语言和不同的面部姿态。
全部评论 (0)
还没有任何评论哟~


