Advertisement

PPASR中文语音识别(顶级版本)模型(大规模数据集)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
简介:PPASR中文语音识别顶级版模型基于大规模数据集训练而成,具备卓越的中文语音转文字能力,适用于各类复杂场景下的精准语音识别需求。 PPASR中文语音识别(最终级)模型使用了大数据集进行训练,源码地址可在GitHub上找到:https://github.com/yeyupiaoling/PPASR。 去掉链接后的版本如下: PPASR中文语音识别(最终级)模型使用了大数据集进行训练。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • PPASR
    优质
    简介:PPASR中文语音识别顶级版模型基于大规模数据集训练而成,具备卓越的中文语音转文字能力,适用于各类复杂场景下的精准语音识别需求。 PPASR中文语音识别(最终级)模型使用了大数据集进行训练,源码地址可在GitHub上找到:https://github.com/yeyupiaoling/PPASR。 去掉链接后的版本如下: PPASR中文语音识别(最终级)模型使用了大数据集进行训练。
  • PPASR(aishell)
    优质
    简介:PPASR是基于AIShell数据集训练的一款高性能中文语音识别模型,适用于多种场景下的语音转文本任务,具有高准确率和低延迟的特点。 PPASR流式与非流式语音识别的deepspeech2模型使用了AIShell数据集,并且源代码可以在GitHub上找到,地址为https://github.com/yeyupiaoling/PPASR。不过根据要求要去除链接,请注意该描述中仅包含技术相关信息,未涉及联系方式或额外网站信息。 重写后: PPASR流式与非流式语音识别采用了基于DeepSpeech2的模型,并使用AIShell数据集进行训练和测试。相关源代码可在相应的GitHub项目页面获取。
  • PPASR基于thchs30(入门
    优质
    本项目提供了一个基于THCHS-30数据集训练的初级中文语音识别模型PPASR,适用于初学者和小型项目。 PPASR中文语音识别(入门级)模型使用free_st_chinese_mandarin_corpus数据集进行训练的源码可以在GitHub上找到。
  • 基于AISHELLPPASR入门
    优质
    本项目提供了一个基于AISHELL数据集训练的轻量级中文语音识别模型PPASR,适合初学者快速上手和研究使用。 PPASR中文语音识别(入门级)模型使用AISHELL数据集进行训练。源码地址可以在GitHub上找到:https://github.com/yeyupiaoling/PPASR/tree/%E5%85%A5%E9%97%A8%E7%BA%A7
  • 基于LibriSpeechPPASR流式和非流式
    优质
    本研究基于LibriSpeech数据集开发了PPASR模型,实现了高效的流式与非流式语音识别技术,提升语音处理速度与准确率。 PPASR流式与非流式语音识别模型使用了LibriSpeech数据集。源码可以在GitHub上找到。
  • 基于Librispeech的的MASR
    优质
    该简介似乎存在一些混淆,题目提到的是基于Librispeech的数据集的MASR中文语音识别模型。LibriSpeech是一个主要用于英语语音识别的大规模数据集,而题目中提及的是用于中文的MASR(可能指的是Model-Aware Speech Recognition)。这看起来像是一个错误或不匹配的情况。 如果意图是介绍一个基于类似LibriSpeech结构但针对中文的大型语料库开发的MASR模型,那么可以这样描述: 简介: MASR是一个中文语音识别模型,基于Librispeech数据集。源码可以在GitHub上找到,地址是https://github.com/yeyupiaoling/MASR。不过根据要求要去掉链接,因此只提供相关信息:该模型的代码托管在GitHub平台上,用户名为yeyupiaoling。
  • -Vosk
    优质
    Vosk是一款开源的非商业中文语音识别引擎,适用于实时和批量转录场景,提供高精度的转换结果且无需网络连接。 Vosk是一个离线开源语音识别工具,支持16种语言的识别,包括中文。通过简单的几行代码即可快速调用其API接口并体验功能。目前仅支持WAV格式的声音文件。 模型下载地址可以在GITHUB源码页面找到,并且提供了不同编程语言(如Python、Node.js和curl)的API调用示例文件供用户参考使用。
  • MASR——基于AIShell(179小时)
    优质
    简介:MASR为一款高效中文语音识别模型,训练基础为包含179小时丰富语料的AIShell数据集,适用于各类语音转文本的应用场景。 MASR是一个中文语音识别模型,并且在aishell数据集上进行了训练,该数据集包含179小时的录音。
  • Conformer件的PPASR V2
    优质
    简介:PPASR V2是基于Conformer架构的语音识别模型更新版,优化了音频处理与解码过程,显著提升了准确率和效率。 PPASR的V2版本使用Fbank训练Conformer模型文件,采用纯PaddlePaddle框架,并利用Wenetspeech数据进行训练。源码可在GitHub上找到相关项目页面。
  • DeepSpeech2件的PPASR V2
    优质
    PPASR V2是基于DeepSpeech2模型优化升级的语音识别系统版本,旨在提供更高效的模型文件和增强的性能。 PPASR的V2版本使用Fbank训练DeepSpeech2模型文件,并采用纯PaddlePaddle框架,训练数据为Wenetspeech。源码地址位于GitHub上的release/2.4.x分支。