Advertisement

CMU汉语普通话的语音识别发音词典(包含多音词)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本资源为卡内基梅隆大学开发的汉语普通话语音识别项目中的发音词典,特别收录了大量常用多音字词,旨在支持更精确的语音识别研究与应用。 CMU汉语普通话语音识别发音词典(包含多音词),共7万个词条。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • CMU
    优质
    本资源为卡内基梅隆大学开发的汉语普通话语音识别项目中的发音词典,特别收录了大量常用多音字词,旨在支持更精确的语音识别研究与应用。 CMU汉语普通话语音识别发音词典(包含多音词),共7万个词条。
  • CMU-Pronouncing-Dictionary:134,000个单信息
    优质
    CMU-Pronouncing-Dictionary是一个庞大的英语发音数据库,收录了超过134,000个单词及其对应的音标和发音方式。它是语言学习、语音识别技术开发的重要资源。 CMU 发音词典(也称为 cmudict)是由卡内基梅隆大学 (CMU) 创建的公共领域发音词典,包含超过 134,000 个单词及其北美发音信息,通常用于语音处理应用程序。 安装方法: 这个包需要 Node.js 版本为 12 或以上才能使用,并且必须通过 import 而不是 require 来导入。 ```shell npm install cmu-pronouncing-dictionary ``` 采用方式如下: ```javascript import { dictionary } from cmu-pronouncing-dictionary; console.log(dictionary); ``` 输出结果为: ```json { a: AH0, a(1): EY1, as: EY1 Z } ```
  • MASR:中文
    优质
    MASR是一款专注于普通话的高效中文语音识别系统,能够准确快速地将口语转换为文本形式,适用于多种场景和应用需求。 MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。该项目采用门控卷积神经网络(Gated Convolutional Network),其结构参考了Facebook在2016年提出的Wav2letter模型,但激活函数使用的是GLU而非HardTanh或ReLU。根据实验结果,使用GLU的收敛速度比使用HardTanh更快。 如果您想研究卷积网络用于语音识别的效果,这个项目可以作为一个很好的参考资料。我们用字错误率(CER)来评估模型的表现,其计算公式为:编辑距离/句子长度,数值越低表示表现越好;大致上1-CER可理解为识别准确率。 该模型使用AISHELL-1数据集进行训练,包含共约150小时的录音,并覆盖了4000多个汉字。然而,在工业界中使用的语音识别系统通常会用至少十倍于此的数据量来训练模型,并且还会根据特定场景调整语料库以优化语言模型。因此,请不要期望本项目能够达到同样水平的表现。
  • Android (-11_098).zip
    优质
    这是一个名为Android 语音通话的压缩文件,包含语音识别相关的代码或资源,于2023年11月9日创建。该文件可能用于开发安卓系统的语音识别应用程序。 安卓语音控制拨打电话等功能可以通过配置相关的XML模块来实现。例如: ```xml
  • 独立.zip
    优质
    独立词语音识别项目提供了一种无需互联网连接即可运行的本地语音转文字解决方案,适用于各种智能设备和应用场景。 基于GMM-HMM的孤立词语音识别系统使用1到10的数字音频进行训练和测试。你可以根据需要调整测试数据的内容,只要相应的标签也做出对应更改即可。该系统的运行依赖于安装hmmlearn、scipy和numpy库。
  • Python-DaCiDian:一个开源中文,适用于自动(ASR)
    优质
    Python-DaCiDian是一款开源的中文普通话词典,专为自动语音识别系统设计,助力开发者提升ASR应用中的语言处理能力。 DaCiDian是一个开源的中文普通话词汇库,用于自动语音识别(ASR)。
  • 库(字与拼
    优质
    《汉语词库》是一部集汉字与拼音于一体的综合性语言工具书,旨在帮助读者准确掌握和使用汉语词汇。 这是一份非常全面的中文txt词库,包含了汉字及其对应的拼音(包括声调),适用于编程使用。
  • 版万能汇库
    优质
    《语音版万能词典词汇库》是一款集成了丰富词条和例句的智能学习工具,支持语音查询,方便用户随时随地轻松查词。 下载后将文件放入万能词典安装目录下的data文件夹中,如果该文件夹不存在,可以自行创建。
  • 基于Matlab实践(括说人、孤立
    优质
    本项目在MATLAB环境下实现语音信号处理与分析,涵盖说话人识别、孤立词识别及语种识别技术,旨在通过实验掌握基础语音识别方法。 程序功能:每次读入1个待识别的mp3语音文件,提取mfcc特征系数,用dtw算法计算与参考模板匹配结果,从而识别出说话者、所说的水果名称以及语种。