Advertisement

TIMIT数据集可供下载。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该TIMIT数据集可作为重要的种子资源进行下载。TIMIT,全称The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus,是由德州仪器(TI)、麻省理工学院(MIT)以及坦福研究院(SRI)共同开发的声学-音素连续语音数据集。为了便于研究,该数据集的语音采样频率设定为16kHz,并包含了总共6300个句子。这些句子是由来自美国八个主要方言地区的630名不同个体所录制,每个人都分别朗读了预先指定的10个句子。此外,所有这些句子在音素级别(即“phone level”)上都经过了人工的细致分割和标记工作。值得注意的是,其中70%的参与者是男性,而大多数说话者均为成年白人。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • TIMIT
    优质
    TIMIT数据集是由美国国家标准与技术研究院(NIST)创建的一个语音数据库,包含了大量的美国英语发音样本,广泛应用于语音识别和声学模型训练。 这是TIMIT数据集的一部分,因为我只能上传不超过220MB的文件。希望你们会喜欢。
  • TIMIT
    优质
    TIMIT数据集是由美国国防部资助的一个语音数据库项目,包含了大量的美式英语发音样本,广泛应用于语音识别和声学模型训练。 DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus是由德州仪器(TI)、麻省理工学院(MIT)和斯坦福研究院(SRI)合作构建的声学-音素连续语音语料库。
  • 多个不平衡
    优质
    本资源提供多种不同比例、规模和领域的不平衡数据集供研究者免费下载,适用于分类算法与模型的研究及测试。 众多不平衡数据集合可供下载,详情请参见数据集说明文档。
  • 应Iris
    优质
    本项目提供经典的Iris(鸢尾花)数据集免费下载服务,适用于机器学习与数据挖掘初学者进行分类算法练习和模型训练。 鸢尾属植物数据集 .iris.data 包含了三类不同的鸢尾属植物:Iris Setosa、Iris Versicolour 和 Iris Virginica。每种类型收集了50个样本,因此这个数据集中一共有150个样本。
  • TIMIT语音
    优质
    TIMIT语音数据集是一个包含大量美国英语口语录音的数据集合,广泛应用于语音识别和声学模型训练中。 TIMIT语音数据集是一个广泛使用的英语语音数据库,在语音识别研究领域具有重要地位。它包含了大量不同发音人的录音样本,涵盖了各种音素、单词以及句子的发音变化,为研究人员提供了丰富的实验材料。该数据集的设计旨在促进对连续话语中声音信号的理解和处理技术的发展,并且已经被用于开发多种自动语音识别系统和技术评估基准测试之中。
  • TIMIT语音
    优质
    TIMIT语音数据集是一套广泛应用于语音识别和声学建模研究的标准数据库,包含大量美国英语发音样本及其转录文本。 一个语音数据库,旨在为希望对音频信号进行处理及分析的人提供帮助。
  • TIMIT语音
    优质
    TIMIT语音数据集是一个广泛使用的英语语音数据库,包含了大量的录音和转录文本,用于语音识别研究和技术开发。 常用TIMIT语音数据库在语音信号处理方面非常实用,包含的都是WAV文件,可以直接调用。
  • timit语音.rar
    优质
    TIMIT语音数据集是一款包含大量美国英语发音的数据资源包,用于语言识别、声学模型训练及评估。 著名的MIT语音库已经处理完毕,可以直接播放或测试使用。由于库文件较大,这里仅提供部分内容。该库包含63个人的录音,每人约有10段录音片段。
  • TIMIT的获取
    优质
    TIMIT数据集简介:包含630名发音人的读音材料,涵盖8种主要方言区,是语音识别领域广泛使用的标准评估资源。本段介绍其获取途径与方法。 TIMIT数据集是由德州仪器(TI)、麻省理工学院(MIT)和斯坦福研究院(SRI)合作构建的声学-音素连续语音语料库。该数据集名为The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus,包含6300个句子,由来自美国八个主要方言地区的630名参与者每人说出10句指定的话。所有句子都在音素级别(phone level)上进行了手动分割和标记。70%的说话人是男性;大多数说话者为成年白人。语音采样频率为16kHz。
  • timitRAR文件
    优质
    TIMIT数据集RAR文件包含了广泛用于语音识别研究的标准声学数据库TIMIT,该数据库包含了大量的美国英语口语录音及对应的转录文本。 TIMIT数据集是由美国630个人每人说十个给定的句子组成的集合,并且每个句子都有相应的标记。以下是该数据集中的一些示例条目格式: ID <-------- SX ---------> <----- SI ----->;--- ---- ----------------------- ---------------- ABC0 1 2 331 61 241 421 151 781 1620 2041 ABW0 1 2 134 314 44 224 404 1230 1664 2294 ADC0 1 2 287 17 197 377 107 737 1367 1997 ADD0 1 2 88 268 448 178 358 538 1295 1798 ADG0 1 2 199 379 109 289 19 649 1279 1909 AEB0 1 2 90 270 450 180 360 990 1411 2250 AEM0 1 2 312 42 222 402 132 762 1392 2022 AEO0 1 2 246 426 156 336 66 1655 1326 1956 AFM0 1 2 39 219 399 129 309 939 1569 2199 AHH0 1 2 214 394 124 304 34 664 1294 1924 AJC0 1 2 385 115 295 25 205 835 1946 2095