Advertisement

AISHELL-3数据集版本

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
AISHELL-3数据集是一款大规模高质量的中文语音识别数据集,包含多样化的录音场景和丰富的语言内容,旨在促进语音技术的研究与开发。 AISHELL-3是由北京贝壳技术有限公司发布的一个大规模、高保真的多说话人普通话语料库,可用于训练多说话人文本到语音(TTS)系统。该语料库包含218名母语为普通话的中国人的约85小时中性情感录音和总计88035条话语记录。他们的辅助属性如性别、年龄段及方言口音在语料库中有明确标注并提供。此外,还提供了中文文本转录。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • AISHELL-3
    优质
    AISHELL-3数据集是一款大规模高质量的中文语音识别数据集,包含多样化的录音场景和丰富的语言内容,旨在促进语音技术的研究与开发。 AISHELL-3是由北京贝壳技术有限公司发布的一个大规模、高保真的多说话人普通话语料库,可用于训练多说话人文本到语音(TTS)系统。该语料库包含218名母语为普通话的中国人的约85小时中性情感录音和总计88035条话语记录。他们的辅助属性如性别、年龄段及方言口音在语料库中有明确标注并提供。此外,还提供了中文文本转录。
  • AISHELL-1样
    优质
    AISHELL-1样本数据集是由数小时高质量普通话录音组成,包含数千句子及词汇,旨在促进语音识别技术的研究与开发。 包括 AISHELL-1_sample 数据集 和 词典。
  • 基于DeepSpeech2的Aishell模型训练
    优质
    本研究采用DeepSpeech2框架,在大规模中文语音数据集Aishell上进行端到端的语音识别模型训练,以提升中文语音识别准确率。 PaddlePaddle实现的DeepSpeech2模型用于训练aishell数据集上的模型,源码可以在GitHub上找到地址为https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech,去掉链接后的内容如下: 使用PaddlePaddle框架实现了DeepSpeech2模型,并用它来对aishell数据集进行训练。相关代码在GitHub上有详细的开源版本。
  • 基于DeepSpeech2的Aishell模型训练
    优质
    本研究利用DeepSpeech2框架,在Aishell中文语音数据集上进行大规模模型训练,优化了中文语音识别性能。 PaddlePaddle实现的DeepSpeech2模型用于训练aishell数据集上的模型,源码地址在GitHub上可以找到。
  • Brats2017
    优质
    Brats2017数据集版本是针对脑肿瘤研究设计的数据集合,包含多种类型的脑部MRI影像,旨在促进对脑肿瘤分割及分析的研究进展。 Brats2017挑战赛的数据集包含t1、t2、tlce、flair等多种模态的数据,并附有百度云下载链接。
  • MASR中文语音识别模型——基于AIShell(179小时)
    优质
    简介:MASR为一款高效中文语音识别模型,训练基础为包含179小时丰富语料的AIShell数据集,适用于各类语音转文本的应用场景。 MASR是一个中文语音识别模型,并且在aishell数据集上进行了训练,该数据集包含179小时的录音。
  • O2O优惠券-
    优质
    本O2O优惠券数据集旨在研究线上到线下营销策略效果,包含用户领取、使用优惠券的行为信息,适用于机器学习模型训练与业务分析。 O2O优惠券数据集-数据集
  • FB15K-237
    优质
    FB15K-237是Freebase知识图谱的一个子集,作为链接预测任务的标准数据集,它通过去除对称和逆关系增强训练数据的挑战性。 数据集的原始来源可以在这里找到:https://www.microsoft.com/en-us/download/details.aspx?id=52312。该数据集由Toutanova和Chen发布。