PPASR中文语音识别（顶级版本）模型（大规模数据集）

5星

浏览量: 0

大小:None

文件类型：None

简介：
简介：PPASR中文语音识别顶级版模型基于大规模数据集训练而成，具备卓越的中文语音转文字能力，适用于各类复杂场景下的精准语音识别需求。 PPASR中文语音识别（最终级）模型使用了大数据集进行训练，源码地址可在GitHub上找到：https://github.com/yeyupiaoling/PPASR。去掉链接后的版本如下： PPASR中文语音识别（最终级）模型使用了大数据集进行训练。

全部评论 (0)

还没有任何评论哟~

客服

PPASR中文语音识别（顶级版本）模型（大规模数据集）

优质

简介：PPASR中文语音识别顶级版模型基于大规模数据集训练而成，具备卓越的中文语音转文字能力，适用于各类复杂场景下的精准语音识别需求。 PPASR中文语音识别（最终级）模型使用了大数据集进行训练，源码地址可在GitHub上找到：https://github.com/yeyupiaoling/PPASR。去掉链接后的版本如下： PPASR中文语音识别（最终级）模型使用了大数据集进行训练。

PPASR中文语音识别（顶级）模型（aishell）

优质

简介：PPASR是基于AIShell数据集训练的一款高性能中文语音识别模型，适用于多种场景下的语音转文本任务，具有高准确率和低延迟的特点。 PPASR流式与非流式语音识别的deepspeech2模型使用了AIShell数据集，并且源代码可以在GitHub上找到，地址为https://github.com/yeyupiaoling/PPASR。不过根据要求要去除链接，请注意该描述中仅包含技术相关信息，未涉及联系方式或额外网站信息。重写后： PPASR流式与非流式语音识别采用了基于DeepSpeech2的模型，并使用AIShell数据集进行训练和测试。相关源代码可在相应的GitHub项目页面获取。

PPASR基于thchs30数据集的中文语音识别（入门级）模型

优质

本项目提供了一个基于THCHS-30数据集训练的初级中文语音识别模型PPASR，适用于初学者和小型项目。 PPASR中文语音识别（入门级）模型使用free_st_chinese_mandarin_corpus数据集进行训练的源码可以在GitHub上找到。

基于AISHELL数据集的PPASR中文语音识别入门级模型

优质

本项目提供了一个基于AISHELL数据集训练的轻量级中文语音识别模型PPASR，适合初学者快速上手和研究使用。 PPASR中文语音识别（入门级）模型使用AISHELL数据集进行训练。源码地址可以在GitHub上找到：https://github.com/yeyupiaoling/PPASR/tree/%E5%85%A5%E9%97%A8%E7%BA%A7

基于LibriSpeech数据集的PPASR流式和非流式语音识别模型

优质

本研究基于LibriSpeech数据集开发了PPASR模型，实现了高效的流式与非流式语音识别技术，提升语音处理速度与准确率。 PPASR流式与非流式语音识别模型使用了LibriSpeech数据集。源码可以在GitHub上找到。

基于Librispeech的数据集的MASR中文语音识别模型

优质

该简介似乎存在一些混淆，题目提到的是基于Librispeech的数据集的MASR中文语音识别模型。LibriSpeech是一个主要用于英语语音识别的大规模数据集，而题目中提及的是用于中文的MASR（可能指的是Model-Aware Speech Recognition）。这看起来像是一个错误或不匹配的情况。如果意图是介绍一个基于类似LibriSpeech结构但针对中文的大型语料库开发的MASR模型，那么可以这样描述：简介： MASR是一个中文语音识别模型，基于Librispeech数据集。源码可以在GitHub上找到，地址是https://github.com/yeyupiaoling/MASR。不过根据要求要去掉链接，因此只提供相关信息：该模型的代码托管在GitHub平台上，用户名为yeyupiaoling。

中文语音识别-Vosk模型

优质

Vosk是一款开源的非商业中文语音识别引擎，适用于实时和批量转录场景，提供高精度的转换结果且无需网络连接。 Vosk是一个离线开源语音识别工具，支持16种语言的识别，包括中文。通过简单的几行代码即可快速调用其API接口并体验功能。目前仅支持WAV格式的声音文件。模型下载地址可以在GITHUB源码页面找到，并且提供了不同编程语言（如Python、Node.js和curl）的API调用示例文件供用户参考使用。

MASR中文语音识别模型——基于AIShell数据集(179小时)

优质

简介：MASR为一款高效中文语音识别模型，训练基础为包含179小时丰富语料的AIShell数据集，适用于各类语音转文本的应用场景。 MASR是一个中文语音识别模型，并且在aishell数据集上进行了训练，该数据集包含179小时的录音。

Conformer模型文件的PPASR V2版本

优质

简介：PPASR V2是基于Conformer架构的语音识别模型更新版，优化了音频处理与解码过程，显著提升了准确率和效率。 PPASR的V2版本使用Fbank训练Conformer模型文件，采用纯PaddlePaddle框架，并利用Wenetspeech数据进行训练。源码可在GitHub上找到相关项目页面。

DeepSpeech2模型文件的PPASR V2版本

优质

PPASR V2是基于DeepSpeech2模型优化升级的语音识别系统版本，旨在提供更高效的模型文件和增强的性能。 PPASR的V2版本使用Fbank训练DeepSpeech2模型文件，并采用纯PaddlePaddle框架，训练数据为Wenetspeech。源码地址位于GitHub上的release/2.4.x分支。

是否确定退出登录?

PPASR中文语音识别（顶级版本）模型（大规模数据集）

全部评论 (0)