
CSTR VCTK 语料库国内版本下载。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该CSTR VCTK语料库包含了109位以不同口音为母语的英语使用者所录制的语音数据。每位参与者均需朗读约400句句子,这些句子主要来源于报纸文章,并辅以彩虹段落和一段旨在辨识演讲者口音的宣传段落。这些报纸文本是在先驱时报集团(Herald & Times Group)的授权下,从苏格兰《先驱报》(The Herald)上提取的。为了最大化上下文信息以及语音覆盖范围,每位演讲者阅读了一组不同的报纸句子,并且这组句子是通过贪婪算法精心挑选的。 彩虹段落和启发性段落的设计是为所有演讲者通用的。 相关的彩虹之旅可以在国际英语方言档案(http://web.ku.edu/~idea/readings/rainbow.htm)中查阅。此外,引出段落与用于语音重音存档(http://accent.gmu.edu)的段落内容一致。 语音口音档案的详细信息可参考http://www.ualberta.ca/~aacl2009/PDFs/WeinbergerKunath2009AACL.pdf获取。 所有语音数据均采用相同的录音设置采集:一个全向头戴式麦克风(DPA 4035),采样频率设定为96kHz, 24位,并在爱丁堡大学的一个半暗室环境中录制。随后,所有录音均被转换为16位格式,并通过STPK进行下采样至48 kHz,并进行手动端点处理。该语料库的设计目的在于构建基于隐马尔可夫模型(HMM)的文本-语音合成系统,特别是针对使用多位发言者训练平均语音模型以及构建基于发言者自适应技术的语音合成系统。 本语料库的使用受到开放数据共享署名许可(ODC-By) v1.0的授权协议:http://opendatacommons.org/licenses/by/1.0/ 和 http://opendatacommons.org/licenses/by/summary/ 。 相关的下载链接为 http://dx.doi.org/10.7488/ds/1994 。 该CSTR VCTK语料库由Christophe Veaux (爱丁堡大学) 和 Junichi Yamagishi (爱丁堡大学) 共同开发,克里斯汀•麦克唐纳也参与了该项目的研究工作。 本研究成果的部分资助来源于EPSRC EP/I031022/1 (NST) 和 EP/J002526/1 (CAF) 项目以及RSE-NSFC资助 (61111130120) 和 JST CREST (uDialogue) 的支持。
全部评论 (0)


