AISHELL-3数据集版本

5星

浏览量: 0

大小:None

文件类型：None

简介：
AISHELL-3数据集是一款大规模高质量的中文语音识别数据集，包含多样化的录音场景和丰富的语言内容，旨在促进语音技术的研究与开发。 AISHELL-3是由北京贝壳技术有限公司发布的一个大规模、高保真的多说话人普通话语料库，可用于训练多说话人文本到语音（TTS）系统。该语料库包含218名母语为普通话的中国人的约85小时中性情感录音和总计88035条话语记录。他们的辅助属性如性别、年龄段及方言口音在语料库中有明确标注并提供。此外，还提供了中文文本转录。

全部评论 (0)

还没有任何评论哟~

客服

AISHELL-3数据集版本

优质

AISHELL-3数据集是一款大规模高质量的中文语音识别数据集，包含多样化的录音场景和丰富的语言内容，旨在促进语音技术的研究与开发。 AISHELL-3是由北京贝壳技术有限公司发布的一个大规模、高保真的多说话人普通话语料库，可用于训练多说话人文本到语音（TTS）系统。该语料库包含218名母语为普通话的中国人的约85小时中性情感录音和总计88035条话语记录。他们的辅助属性如性别、年龄段及方言口音在语料库中有明确标注并提供。此外，还提供了中文文本转录。

AISHELL-1样本数据集

优质

AISHELL-1样本数据集是由数小时高质量普通话录音组成，包含数千句子及词汇，旨在促进语音识别技术的研究与开发。包括 AISHELL-1_sample 数据集和词典。

基于DeepSpeech2的Aishell数据集模型训练

优质

本研究采用DeepSpeech2框架，在大规模中文语音数据集Aishell上进行端到端的语音识别模型训练，以提升中文语音识别准确率。 PaddlePaddle实现的DeepSpeech2模型用于训练aishell数据集上的模型，源码可以在GitHub上找到地址为https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech，去掉链接后的内容如下：使用PaddlePaddle框架实现了DeepSpeech2模型，并用它来对aishell数据集进行训练。相关代码在GitHub上有详细的开源版本。

基于DeepSpeech2的Aishell数据集模型训练

优质

本研究利用DeepSpeech2框架，在Aishell中文语音数据集上进行大规模模型训练，优化了中文语音识别性能。 PaddlePaddle实现的DeepSpeech2模型用于训练aishell数据集上的模型，源码地址在GitHub上可以找到。

Brats2017数据集版本

优质

Brats2017数据集版本是针对脑肿瘤研究设计的数据集合，包含多种类型的脑部MRI影像，旨在促进对脑肿瘤分割及分析的研究进展。 Brats2017挑战赛的数据集包含t1、t2、tlce、flair等多种模态的数据，并附有百度云下载链接。

MASR中文语音识别模型——基于AIShell数据集(179小时)

优质

简介：MASR为一款高效中文语音识别模型，训练基础为包含179小时丰富语料的AIShell数据集，适用于各类语音转文本的应用场景。 MASR是一个中文语音识别模型，并且在aishell数据集上进行了训练，该数据集包含179小时的录音。

O2O优惠券数据集-数据集版本

优质

本O2O优惠券数据集旨在研究线上到线下营销策略效果，包含用户领取、使用优惠券的行为信息，适用于机器学习模型训练与业务分析。 O2O优惠券数据集-数据集

基于AISHELL数据集的PPASR中文语音识别入门级模型

优质

本项目提供了一个基于AISHELL数据集训练的轻量级中文语音识别模型PPASR，适合初学者快速上手和研究使用。 PPASR中文语音识别（入门级）模型使用AISHELL数据集进行训练。源码地址可以在GitHub上找到：https://github.com/yeyupiaoling/PPASR/tree/%E5%85%A5%E9%97%A8%E7%BA%A7

是否确定退出登录?

AISHELL-3数据集版本

全部评论 (0)