语言可接受性数据集（Corpus of Linguistic Acceptability）是一个数据集。

5星

浏览量: 0

大小:None

文件类型：None

简介：
该语言可接受性语料库是由纽约大学提供的。其中包含CoLA_original.zip、CoLA_test.tsv、CoLA_dev.tsv和CoLA_train.tsv这四个数据集文件。

全部评论 (0)

还没有任何评论哟~

客服

语言可接受性语料库-数据集

优质

语言可接受性语料库-数据集包含大量经人工评判的语言结构实例，旨在研究人类语言使用的规范性和创造性，为自然语言处理和理论语言学提供宝贵资源。《语言可接受性语料库》由纽约大学提供。该数据集包含以下文件：CoLA_original.zip、CoLA_test.tsv、CoLA_dev.tsv 和 CoLA_train.tsv。

Wikitext-2数据集是Torchtext中的一个自然语言建模数据集

优质

Wikitext-2是Torchtext中用于自然语言建模的数据集，包含大量来自维基百科的文章片段，旨在促进文本生成和预测任务的研究。 wikitext-2数据集是torchtext中用于自然语言建模的数据集之一，它从Wikipedia的优质文章和标杆文章中提取而来。由于网络原因无法自动下载，可以将压缩包解压并放置到torchtext的root目录或工程目录下以进行运行。

布朗语料库（Brown Corpus）- 数据集

优质

布朗语料库是一份经典英语文本数据集，包含50万单词的美国英语样本，按主题和文体分类，为语言分析、模型训练等提供基础资源。布朗语料库是美国英语的首个文本语料库，它取自不同主题的报纸、书籍以及政府文件，包含1,014,312个单词。该语料库主要用于语言建模，并提供了cats.csv、brown-meta.json和brown.csv等数据文件。

手语数字数据集_手语数据集_数字手语数据集

优质

这是一个专门收集和整理的手语数字表达的数据集合，旨在为研究者、开发者以及聋人社区提供一个标准化的资源库，促进手语识别技术的发展与应用。手语数字数据集用于训练分类SVM模型。

数据集：数据可视化的数据集

优质

这是一个专为数据可视化设计的数据集，包含丰富多样的数据类型和结构，旨在帮助用户提升其数据分析与展示能力。数据可视化类的数据集。

线性回归数据集 - 数据集

优质

本数据集专为线性回归分析设计，包含多个特征变量及对应的连续目标值，适用于模型训练与评估。练习线性回归的数据集可以使用名为Linear Regression - Sheet1.csv的文件。

印度手语数据集 - 数据集

优质

印度手语数据集是一套专为印度手语设计的数据集合，包含大量手势图像和视频资料，旨在促进印度手语的研究与应用。这是一个印度手语数据集：Indian Sign Language Dataset_datasets.txt 和 Indian Sign Language Dataset_datasets.zip。

是否确定退出登录?

语言可接受性数据集（Corpus of Linguistic Acceptability）是一个数据集。

全部评论 (0)