Advertisement

语言可接受性数据集(Corpus of Linguistic Acceptability)是一个数据集。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该语言可接受性语料库是由纽约大学提供的。其中包含CoLA_original.zip、CoLA_test.tsv、CoLA_dev.tsv和CoLA_train.tsv这四个数据集文件。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 料库-
    优质
    语言可接受性语料库-数据集包含大量经人工评判的语言结构实例,旨在研究人类语言使用的规范性和创造性,为自然语言处理和理论语言学提供宝贵资源。 《语言可接受性语料库》由纽约大学提供。该数据集包含以下文件:CoLA_original.zip、CoLA_test.tsv、CoLA_dev.tsv 和 CoLA_train.tsv。
  • Wikitext-2Torchtext中的自然建模
    优质
    Wikitext-2是Torchtext中用于自然语言建模的数据集,包含大量来自维基百科的文章片段,旨在促进文本生成和预测任务的研究。 wikitext-2数据集是torchtext中用于自然语言建模的数据集之一,它从Wikipedia的优质文章和标杆文章中提取而来。由于网络原因无法自动下载,可以将压缩包解压并放置到torchtext的root目录或工程目录下以进行运行。
  • 布朗料库(Brown Corpus)-
    优质
    布朗语料库是一份经典英语文本数据集,包含50万单词的美国英语样本,按主题和文体分类,为语言分析、模型训练等提供基础资源。 布朗语料库是美国英语的首个文本语料库,它取自不同主题的报纸、书籍以及政府文件,包含1,014,312个单词。该语料库主要用于语言建模,并提供了cats.csv、brown-meta.json和brown.csv等数据文件。
  • _手_字手
    优质
    这是一个专门收集和整理的手语数字表达的数据集合,旨在为研究者、开发者以及聋人社区提供一个标准化的资源库,促进手语识别技术的发展与应用。 手语数字数据集用于训练分类SVM模型。
  • 视化的
    优质
    这是一个专为数据可视化设计的数据集,包含丰富多样的数据类型和结构,旨在帮助用户提升其数据分析与展示能力。 数据可视化类的数据集。
  • 线回归 -
    优质
    本数据集专为线性回归分析设计,包含多个特征变量及对应的连续目标值,适用于模型训练与评估。 练习线性回归的数据集可以使用名为Linear Regression - Sheet1.csv的文件。
  • 印度手 -
    优质
    印度手语数据集是一套专为印度手语设计的数据集合,包含大量手势图像和视频资料,旨在促进印度手语的研究与应用。 这是一个印度手语数据集:Indian Sign Language Dataset_datasets.txt 和 Indian Sign Language Dataset_datasets.zip。