Advertisement

CSTR VCTK 语料库国内版本下载。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该CSTR VCTK语料库包含了109位以不同口音为母语的英语使用者所录制的语音数据。每位参与者均需朗读约400句句子,这些句子主要来源于报纸文章,并辅以彩虹段落和一段旨在辨识演讲者口音的宣传段落。这些报纸文本是在先驱时报集团(Herald & Times Group)的授权下,从苏格兰《先驱报》(The Herald)上提取的。为了最大化上下文信息以及语音覆盖范围,每位演讲者阅读了一组不同的报纸句子,并且这组句子是通过贪婪算法精心挑选的。 彩虹段落和启发性段落的设计是为所有演讲者通用的。 相关的彩虹之旅可以在国际英语方言档案(http://web.ku.edu/~idea/readings/rainbow.htm)中查阅。此外,引出段落与用于语音重音存档(http://accent.gmu.edu)的段落内容一致。 语音口音档案的详细信息可参考http://www.ualberta.ca/~aacl2009/PDFs/WeinbergerKunath2009AACL.pdf获取。 所有语音数据均采用相同的录音设置采集:一个全向头戴式麦克风(DPA 4035),采样频率设定为96kHz, 24位,并在爱丁堡大学的一个半暗室环境中录制。随后,所有录音均被转换为16位格式,并通过STPK进行下采样至48 kHz,并进行手动端点处理。该语料库的设计目的在于构建基于隐马尔可夫模型(HMM)的文本-语音合成系统,特别是针对使用多位发言者训练平均语音模型以及构建基于发言者自适应技术的语音合成系统。 本语料库的使用受到开放数据共享署名许可(ODC-By) v1.0的授权协议:http://opendatacommons.org/licenses/by/1.0/ 和 http://opendatacommons.org/licenses/by/summary/ 。 相关的下载链接为 http://dx.doi.org/10.7488/ds/1994 。 该CSTR VCTK语料库由Christophe Veaux (爱丁堡大学) 和 Junichi Yamagishi (爱丁堡大学) 共同开发,克里斯汀•麦克唐纳也参与了该项目的研究工作。 本研究成果的部分资助来源于EPSRC EP/I031022/1 (NST) 和 EP/J002526/1 (CAF) 项目以及RSE-NSFC资助 (61111130120) 和 JST CREST (uDialogue) 的支持。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • CSTR VCTK
    优质
    简介:CSTR VCTK语料库是国内语音技术研究者和开发者常用的开源音讯资料库,提供多样化的英語語音数据,适用于文本到语音(TTS)系统的训练与测试。本页面提供该语料库的国内下载链接,方便研究人员获取资源。 CSTR VCTK语音克隆英语多说话人语料库工具包概述 这个CSTR VCTK语料库包含了109位以不同口音为母语的英语使用者的语音数据。每位演讲者要朗读大约400句句子,其中大部分是从报纸上挑选出来的,并且包括彩虹段落和一段旨在识别演讲者口音的启事段落。 这些报纸文本是在先驱时报集团(Herald & Times Group)许可下从格拉斯哥《先驱报》(The Herald)摘取的。每位演讲者阅读一组不同的报纸句子,每组句子都是通过贪婪算法选择的,该算法旨在最大限度地扩大上下文和语音覆盖范围。 彩虹段落和启事段落对所有演讲者都是一样的。关于这些文本的具体信息可以在国际英语方言档案(http://web.ku.edu/~idea/readings/rainbow.htm)中找到。启事段落与用于语音重音存档的段落相同,而有关语音口音档案的细节可以查阅相关文献。 所有的语音数据都是使用相同的录音设置记录的:一个全向头戴式麦克风(DPA 4035),采样频率为96kHz, 24位,在爱丁堡大学半暗室中。所有录音均转换为16位,基于STPK下采样至48 kHz,并手动端点。 该语料库的录制是为了构建基于hmm的文本-语音合成系统,特别是用于使用多个发言者训练的平均语音模型和说话人自适应技术来创建基于说话人自适应的语音合成系统。 此数据集是在开放数据共享署名许可(ODC-By) v1.0下授权使用的。 该语料库由Christophe Veaux(爱丁堡大学)、Junichi Yamagishi(爱丁堡大学)和克里斯汀•麦克唐纳共同创建,部分研究得到了EPSRC EP/I031022/1 (NST) 和EP/J002526/1 (CAF) 的资助。此外,还获得了来自RSE-NSFC的资助(61111130120)和JST CREST (uDialogue)的支持。
  • boot2docker.iso v19.03.12
    优质
    boot2docker.iso v19.03.12 国内下载版是专为中国用户优化的Docker快速启动ISO镜像,包含v19.03.12版本,支持在Windows和Mac系统上便捷安装与使用Docker。 下载boot2docker.iso版本v19.03.12,并将文件复制到C:\Users\用户名\.docker\machine\cache\boot2docker.iso目录中,然后重新打开Docker Quickstart Terminal。
  • QGIS-OSGeo4W-3.12.1-1-Setup-x86_64.zip
    优质
    这是一个包含QGIS 3.12.1版本软件安装包的压缩文件,专为Windows系统设计,适用于地理信息系统(GIS)领域的专业人士和爱好者。 QGIS(原称Quantum GIS)是一个开源的桌面地理信息系统软件。它支持数据展示、编辑以及分析功能,并提供了一个用户友好的界面。该程序可以在Linux、Unix、Mac OSX 和 Windows 等多种操作系统上运行。 QGIS 使用 Qt 图形库和 C++ 语言开发,从2002年5月开始项目至今已发展成为一个活跃的开源 GIS 软件平台。截至当前(即2014年的信息),最新版本为 QGIS 2.4 版本。QGIS 的源代码遵循 GNU General Public License 协议对外发布。 对于需要下载 Windows x86_64 架构 QGIS OSGeo4W v3.12.1 安装包的用户,建议寻找国内镜像站点以提高下载速度。
  • FLOB
    优质
    FLOB(British English Corpus)是专门收录当代标准英国英语文本的高质量语料库,为语言研究和教学提供了宝贵的资源。 自由堡一罗博英国本族语语料库(FLOB)常常被用来与CLEC语料库进行对比分析研究。尽管它的例句数量不多,规模有待进一步扩大,但作为样本语料库已经足够使用了。
  • NLTK数据:NLTK
    优质
    NLTK数据简介:NLTK语料库提供了一个丰富的语言资源集合,便于进行自然语言处理和文本分析研究。本项目专注于这些宝贵资料的获取与使用。 最近在学习Python自然语言处理时需要用到nltk库的各种内置语料库,但发现使用`nltk.download()`命令下载时常会中途卡住,导致浪费了很多时间。这里分享一下这个问题给大家。
  • Kibana 各地址及 kibana-7.8.0-windows-x86_64.zip 文件
    优质
    本文提供Kibana各版本在国内的便捷下载链接,并特别指出kibana-7.8.0-windows-x86_64.zip文件的下载位置,帮助用户快速获取所需资源。 Kibana 各个版本的国内下载链接以及 kibana-7.8.0-windows-x86_64.zip 的下载地址可以找到。
  • NLTK数据离线
    优质
    NLTK数据语料库离线下载是指将自然语言处理工具包NLTK所需的各类文本、词汇等资源预先存储在本地计算机上,以供离线环境下进行语言分析和模型训练使用。 nltk_data corpora 可以离线下载其中包含stopwords,用于去除停止词。
  • Git在
    优质
    本文将介绍如何在中国环境下成功下载和使用Git版本控制系统,包括配置代理、克隆仓库等步骤。 为了帮助国内的朋友们更快地下载所需内容,我会尽快提供一个更适合国内环境的下载方式。如果有任何问题或建议,请随时告诉我。