Advertisement

AISHELL-3数据集版本

  • 5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
AISHELL-3数据集是一款大规模高质量的中文语音识别数据集,包含多样化的录音场景和丰富的语言内容,旨在促进语音技术的研究与开发。 AISHELL-3是由北京贝壳技术有限公司发布的一个大规模、高保真的多说话人普通话语料库,可用于训练多说话人文本到语音(TTS)系统。该语料库包含218名母语为普通话的中国人的约85小时中性情感录音和总计88035条话语记录。他们的辅助属性如性别、年龄段及方言口音在语料库中有明确标注并提供。此外,还提供了中文文本转录。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • AISHELL-3
    优质
    AISHELL-3数据集是一款大规模高质量的中文语音识别数据集,包含多样化的录音场景和丰富的语言内容,旨在促进语音技术的研究与开发。 AISHELL-3是由北京贝壳技术有限公司发布的一个大规模、高保真的多说话人普通话语料库,可用于训练多说话人文本到语音(TTS)系统。该语料库包含218名母语为普通话的中国人的约85小时中性情感录音和总计88035条话语记录。他们的辅助属性如性别、年龄段及方言口音在语料库中有明确标注并提供。此外,还提供了中文文本转录。
  • AISHELL-1样
    优质
    AISHELL-1样本数据集是由数小时高质量普通话录音组成,包含数千句子及词汇,旨在促进语音识别技术的研究与开发。 包括 AISHELL-1_sample 数据集 和 词典。
  • 基于DeepSpeech2的Aishell模型训练
    优质
    本研究采用DeepSpeech2框架,在大规模中文语音数据集Aishell上进行端到端的语音识别模型训练,以提升中文语音识别准确率。 PaddlePaddle实现的DeepSpeech2模型用于训练aishell数据集上的模型,源码可以在GitHub上找到地址为https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech,去掉链接后的内容如下: 使用PaddlePaddle框架实现了DeepSpeech2模型,并用它来对aishell数据集进行训练。相关代码在GitHub上有详细的开源版本。
  • 基于DeepSpeech2的Aishell模型训练
    优质
    本研究利用DeepSpeech2框架,在Aishell中文语音数据集上进行大规模模型训练,优化了中文语音识别性能。 PaddlePaddle实现的DeepSpeech2模型用于训练aishell数据集上的模型,源码地址在GitHub上可以找到。
  • Brats2017
    优质
    Brats2017数据集版本是针对脑肿瘤研究设计的数据集合,包含多种类型的脑部MRI影像,旨在促进对脑肿瘤分割及分析的研究进展。 Brats2017挑战赛的数据集包含t1、t2、tlce、flair等多种模态的数据,并附有百度云下载链接。
  • MASR中文语音识别模型——基于AIShell(179小时)
    优质
    简介:MASR为一款高效中文语音识别模型,训练基础为包含179小时丰富语料的AIShell数据集,适用于各类语音转文本的应用场景。 MASR是一个中文语音识别模型,并且在aishell数据集上进行了训练,该数据集包含179小时的录音。
  • O2O优惠券-
    优质
    本O2O优惠券数据集旨在研究线上到线下营销策略效果,包含用户领取、使用优惠券的行为信息,适用于机器学习模型训练与业务分析。 O2O优惠券数据集-数据集
  • 基于AISHELL的PPASR中文语音识别入门级模型
    优质
    本项目提供了一个基于AISHELL数据集训练的轻量级中文语音识别模型PPASR,适合初学者快速上手和研究使用。 PPASR中文语音识别(入门级)模型使用AISHELL数据集进行训练。源码地址可以在GitHub上找到:https://github.com/yeyupiaoling/PPASR/tree/%E5%85%A5%E9%97%A8%E7%BA%A7