Advertisement

中文和英文的语音识别测试WAV数据集(共400条)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本数据集包含400条中英文语音识别测试样本,旨在评估与优化语音识别系统的准确性和效率。每条音频文件均为WAV格式。 语音数据都是网上开源的,我将这些语音统一为wav格式,可以用于测试paddlespeech/whisper等语音识别模型。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • WAV400
    优质
    本数据集包含400条中英文语音识别测试样本,旨在评估与优化语音识别系统的准确性和效率。每条音频文件均为WAV格式。 语音数据都是网上开源的,我将这些语音统一为wav格式,可以用于测试paddlespeech/whisper等语音识别模型。
  • 包含500WAV格式,适用于模型
    优质
    这是一个包含500条WAV格式中文语音数据的数据集,专为评估和优化中文语音识别系统的性能而设计。 包含500条WAV格式的中文语音数据集,适用于中文语音识别模型的测试。这些音频质量优秀,非常适合相关研究与开发使用。
  • MATLAB程序(含40个频)
    优质
    本资源包含用于训练和评估中英文语音识别系统的MATLAB代码及40段测试音频文件,适用于自然语言处理与机器学习课程。 使用MFCC和LPC作为特征进行SVM训练的识别正确率为90%,虽然这项技术表现不算出色,但足够用于提交作业。
  • 离线(支持
    优质
    本工具提供离线中英文语音评测及识别服务,无需网络连接,保障用户数据安全,适用于语言学习、听力训练等多种场景。 离线语音评测及语音识别支持中文和英文。
  • .wav格式
    优质
    这段音频文件是以.wav格式录制的语音测试样本,适用于检测设备的声音播放和录音功能。 百度语音测试文件已转换为文字,并经过亲自测试确认可以使用。
  • 0到9十个WAV
    优质
    本资源包包含了从0至9所有阿拉伯数字的中英双语发音WAV音频文件,适合用于语言学习、多媒体项目或应用程序开发中的语音合成与测试。 提供0-9十个数字的中文和英文语音文件(wav格式)以及A-Z 26个英文字母的WAV文件,可用于IVR语音报号和语音验证码。
  • CTC-LSTM-ENSPEECH-
    优质
    CTC-LSTM-ENSPEECH是一种先进的英文语音识别模型,结合了连接时序分类(CTC)与长短时记忆网络(LSTM),通过集成学习提升准确率。 英语语音识别项目试验,仅供学习。
  • 基于LibrispeechMASR模型
    优质
    该简介似乎存在一些混淆,题目提到的是基于Librispeech的数据集的MASR中文语音识别模型。LibriSpeech是一个主要用于英语语音识别的大规模数据集,而题目中提及的是用于中文的MASR(可能指的是Model-Aware Speech Recognition)。这看起来像是一个错误或不匹配的情况。 如果意图是介绍一个基于类似LibriSpeech结构但针对中文的大型语料库开发的MASR模型,那么可以这样描述: 简介: MASR是一个中文语音识别模型,基于Librispeech数据集。源码可以在GitHub上找到,地址是https://github.com/yeyupiaoling/MASR。不过根据要求要去掉链接,因此只提供相关信息:该模型的代码托管在GitHub平台上,用户名为yeyupiaoling。
  • 用于年龄
    优质
    本数据集包含多样的语音样本,旨在训练和评估机器学习模型进行语音年龄识别。涵盖广泛年龄段及性别,适用于研究与开发需求。 该数据集包含200条语音文件,格式为wav。这些语音被分为四个年龄段:<19岁、20-29岁、30-39岁和40-49岁,每个年龄段各有50条语音记录。这一集合非常适合用于训练年龄识别的模型。
  • WAV
    优质
    这是一段用于测试的WAV格式音频文件,适用于检验音频播放设备或软件的功能和性能。 wav音频文件,供测试用。