Advertisement

经过裁剪的THCHS30语音识别数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本数据集为THCHS-30语音识别库的部分精简版本,适用于快速原型开发与模型训练。包含了精选高质量中文读音样本。 基于ASRT_SpeechRecognition开源项目,对用于训练的数据集进行裁剪,以便在低性能机器上进行训练和学习。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • THCHS30
    优质
    本数据集为THCHS-30语音识别库的部分精简版本,适用于快速原型开发与模型训练。包含了精选高质量中文读音样本。 基于ASRT_SpeechRecognition开源项目,对用于训练的数据集进行裁剪,以便在低性能机器上进行训练和学习。
  • PPASR基于thchs30中文(入门级)模型
    优质
    本项目提供了一个基于THCHS-30数据集训练的初级中文语音识别模型PPASR,适用于初学者和小型项目。 PPASR中文语音识别(入门级)模型使用free_st_chinese_mandarin_corpus数据集进行训练的源码可以在GitHub上找到。
  • LFW人脸[及对齐]
    优质
    LFW人脸识别数据集[裁剪及对齐]包含多张名人面部照片,旨在评估机器学习算法在人脸检测与识别任务中的准确性。 经典的LFW人脸识别数据集已经经过裁剪和对齐处理。筛选出拥有超过10张图像的共99人,并已进行分类。这些图片为彩色jpg格式,像素尺寸为250x250。
  • TIMIT
    优质
    TIMIT 语音识别数据集是一个包含大量美国英语演讲录音及转录文本的数据集合,广泛应用于声学模型训练和评估。 TIMIT Acoustic Phonetic Continuous Speech Corpus 是一个英语语音识别数据集,包含630人来自美国8个不同地区的方言录音。
  • CTW1500
    优质
    CTW1500语音识别数据集是一个包含超过一千五百小时高质量中文语音录音的数据集合,旨在促进先进的语音识别技术的研究和开发。 深度学习模型ABCNet可以使用多个数据集进行训练和测试。
  • 基于PyTorch流式和非流式模型实现(使用thchs30
    优质
    本项目采用PyTorch框架,在thchs30数据集上实现了流式与非流式语音识别模型,旨在提升语音识别效率及准确率。 Pytorch实现的流式与非流式语音识别模型使用了thchs30数据集。源码可以在GitHub上找到,地址是https://github.com/yeyupiaoling/MASR。不过根据要求要去除链接,因此只提供描述:该项目实现了基于PyTorch框架的流式和非流式语音识别系统,并且采用了名为thchs30的数据集进行训练和测试。
  • 车牌库:自制拍摄与
    优质
    本项目致力于构建一个高质量的车牌识别数据集,通过自制拍摄和精细裁剪技术,确保图像清晰、多样,为机器学习模型提供可靠训练素材。 需要几百张车牌比较正的图片,用于车牌识别的训练及测试。
  • 基于类YOLO图像
    优质
    基于类别的YOLO图像裁剪识别是一种结合了目标检测与图像裁剪技术的方法,利用改进的YOLO算法对特定类别目标进行精确定位和高效裁剪,从而提高模型在复杂场景下的识别准确率。 1. YOLO识别图像后生成的txt文件可以用于裁剪图像,只保留所需的区域。 2. 使用Python3在Windows环境下实现这一功能。 3. 可以通过输入文件夹路径来批量自动转换图像。
  • WebFace人脸[修]
    优质
    WebFace人脸识别数据集[修剪]” 是一个精选的人脸识别数据集合,包含多样化的面部图像,旨在促进人脸识别技术的研究与开发。 非限制条件下的人脸识别数据集基于原始的webface数据集进行了筛选,选取了80个拥有超过100张图像的人物,并使用Dlib库进行人脸定位与裁剪处理。所有图片已经分类并保存为彩色jpg格式,尺寸统一为224x224像素。