中文和英文的语音识别测试WAV数据集（共400条）

5星

浏览量: 0

大小:None

文件类型：None

简介：
本数据集包含400条中英文语音识别测试样本，旨在评估与优化语音识别系统的准确性和效率。每条音频文件均为WAV格式。语音数据都是网上开源的，我将这些语音统一为wav格式，可以用于测试paddlespeech/whisper等语音识别模型。

全部评论 (0)

还没有任何评论哟~

客服

中文和英文的语音识别测试WAV数据集（共400条）

优质

本数据集包含400条中英文语音识别测试样本，旨在评估与优化语音识别系统的准确性和效率。每条音频文件均为WAV格式。语音数据都是网上开源的，我将这些语音统一为wav格式，可以用于测试paddlespeech/whisper等语音识别模型。

包含500条WAV格式中文语音的数据集，适用于中文语音识别模型测试

优质

这是一个包含500条WAV格式中文语音数据的数据集，专为评估和优化中文语音识别系统的性能而设计。包含500条WAV格式的中文语音数据集，适用于中文语音识别模型的测试。这些音频质量优秀，非常适合相关研究与开发使用。

中英文语音识别的MATLAB程序（含40个测试音频）

优质

本资源包含用于训练和评估中英文语音识别系统的MATLAB代码及40段测试音频文件，适用于自然语言处理与机器学习课程。使用MFCC和LPC作为特征进行SVM训练的识别正确率为90%，虽然这项技术表现不算出色，但足够用于提交作业。

离线语音评测与语音识别（支持中英文）

优质

本工具提供离线中英文语音评测及识别服务，无需网络连接，保障用户数据安全，适用于语言学习、听力训练等多种场景。离线语音评测及语音识别支持中文和英文。

.wav格式语音测试文件

优质

这段音频文件是以.wav格式录制的语音测试样本，适用于检测设备的声音播放和录音功能。百度语音测试文件已转换为文字，并经过亲自测试确认可以使用。

0到9十个数字的中英文语音WAV文件

优质

本资源包包含了从0至9所有阿拉伯数字的中英双语发音WAV音频文件，适合用于语言学习、多媒体项目或应用程序开发中的语音合成与测试。提供0-9十个数字的中文和英文语音文件（wav格式）以及A-Z 26个英文字母的WAV文件，可用于IVR语音报号和语音验证码。

CTC-LSTM-ENSPEECH-英文语音识别

优质

CTC-LSTM-ENSPEECH是一种先进的英文语音识别模型，结合了连接时序分类（CTC）与长短时记忆网络（LSTM），通过集成学习提升准确率。英语语音识别项目试验，仅供学习。

基于Librispeech的数据集的MASR中文语音识别模型

优质

该简介似乎存在一些混淆，题目提到的是基于Librispeech的数据集的MASR中文语音识别模型。LibriSpeech是一个主要用于英语语音识别的大规模数据集，而题目中提及的是用于中文的MASR（可能指的是Model-Aware Speech Recognition）。这看起来像是一个错误或不匹配的情况。如果意图是介绍一个基于类似LibriSpeech结构但针对中文的大型语料库开发的MASR模型，那么可以这样描述：简介： MASR是一个中文语音识别模型，基于Librispeech数据集。源码可以在GitHub上找到，地址是https://github.com/yeyupiaoling/MASR。不过根据要求要去掉链接，因此只提供相关信息：该模型的代码托管在GitHub平台上，用户名为yeyupiaoling。

用于语音年龄识别的数据集文件

优质

本数据集包含多样的语音样本，旨在训练和评估机器学习模型进行语音年龄识别。涵盖广泛年龄段及性别，适用于研究与开发需求。该数据集包含200条语音文件，格式为wav。这些语音被分为四个年龄段：<19岁、20-29岁、30-39岁和40-49岁，每个年龄段各有50条语音记录。这一集合非常适合用于训练年龄识别的模型。

WAV音频文件测试文件

优质

是否确定退出登录?

中文和英文的语音识别测试WAV数据集（共400条）

全部评论 (0)