
SST-2数据集 - SST-2 Dataset
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
简介:SST-2数据集是用于句子级别的情感分类任务的数据集合,包含电影评论的正面或负面标签,广泛应用于自然语言处理领域的文本分类研究。
SST-2(Stanford Sentiment Treebank)是由斯坦福大学的研究人员创建的一个用于情感分析的标记数据集。其主要目的是帮助研究人员和开发者训练及评估情感分析模型。该数据集中包含来自电影评论网站Rotten Tomatoes上的句子,每个句子都被标注为正面或负面的情感。
SST-2的数据集具有以下特点:
1. **二分类标签**:每个句子被标记为正向或负向情绪,使其成为一个典型的二元分类问题。
2. **层次结构**:除了在句子级别上进行情感标定外,该数据集还详细记录了句子的语法构造。具体而言,每一个评论都被映射到一棵反映其语法规则的树中,这使得研究者可以深入探索句法结构对情绪分析的影响。
3. **来源说明**:SST-2中的所有句子均源自Rotten Tomatoes网站上的电影观众评价和反馈。
该数据集的应用范围广泛,包括但不限于:
- 训练并评估情感分类模型;
- 研究语法构造在情绪识别中的作用;
- 自然语言处理技术的开发与优化。
全部评论 (0)
还没有任何评论哟~


