Advertisement

IMDb、SST-1、SST-2、Yelp-2013、Yelp-2014文本分类数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本数据集包含IMDb电影评论及SST-1/2与Yelp-2013/2014的用户评价,适用于训练和评估情感分析中的文本分类模型。 IMDb、SST-1、SST-2、yelp-2013 和 yelp-2014 是用于文本分类的数据集。这些数据集可以在 GitHub 上找到,具体地址为 https://github.com/JerrikEph/Capsule4TextClassification/blob/master/data/downloadDataset.md 。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • IMDbSST-1SST-2Yelp-2013Yelp-2014
    优质
    本数据集包含IMDb电影评论及SST-1/2与Yelp-2013/2014的用户评价,适用于训练和评估情感分析中的文本分类模型。 IMDb、SST-1、SST-2、yelp-2013 和 yelp-2014 是用于文本分类的数据集。这些数据集可以在 GitHub 上找到,具体地址为 https://github.com/JerrikEph/Capsule4TextClassification/blob/master/data/downloadDataset.md 。
  • SST-2 - SST-2 Dataset
    优质
    简介:SST-2数据集是用于句子级别的情感分类任务的数据集合,包含电影评论的正面或负面标签,广泛应用于自然语言处理领域的文本分类研究。 SST-2(Stanford Sentiment Treebank)是由斯坦福大学的研究人员创建的一个用于情感分析的标记数据集。其主要目的是帮助研究人员和开发者训练及评估情感分析模型。该数据集中包含来自电影评论网站Rotten Tomatoes上的句子,每个句子都被标注为正面或负面的情感。 SST-2的数据集具有以下特点: 1. **二分类标签**:每个句子被标记为正向或负向情绪,使其成为一个典型的二元分类问题。 2. **层次结构**:除了在句子级别上进行情感标定外,该数据集还详细记录了句子的语法构造。具体而言,每一个评论都被映射到一棵反映其语法规则的树中,这使得研究者可以深入探索句法结构对情绪分析的影响。 3. **来源说明**:SST-2中的所有句子均源自Rotten Tomatoes网站上的电影观众评价和反馈。 该数据集的应用范围广泛,包括但不限于: - 训练并评估情感分类模型; - 研究语法构造在情绪识别中的作用; - 自然语言处理技术的开发与优化。
  • Yelp挑战:Yelp竞赛
    优质
    Yelp挑战赛基于庞大的Yelp数据集,旨在通过数据分析和机器学习技术来解决实际商业问题,吸引全球的数据科学爱好者参与。 Yelp挑战(美食家挑战)是基于Yelp数据集的自然语言处理项目。该项目使用了来自美国各地用户在Yelp上发布的餐厅评论以及注册餐厅的信息。我选择了2016年至2018年的评论进行模型训练和测试,原始数据总量约为1GB。 整个项目分为三个主要部分: - 数据预处理 - 自然语言处理与情绪分析(使用朴素贝叶斯分类器) - 推荐系统
  • Yelp
    优质
    本项目通过对Yelp数据集进行深入分析,探索用户评价、商家分布及社交网络特征,旨在挖掘本地商业市场的潜在规律和趋势。 Yelp数据集可以用于构建推荐系统。该数据集包含了丰富的用户评价、商家信息等内容,非常适合用来开发高效的推荐算法和服务。
  • Yelp.zip
    优质
    Yelp数据集包含来自Yelp平台的各种用户评论、企业信息和用户资料等大数据资源,适用于数据分析、机器学习模型训练及自然语言处理研究。 Yelp数据集是我们业务、评论和用户数据的一个子集,可用于个人、教育和学术目的。该数据集以JSON文件形式提供,可以用于教授学生数据库知识,学习自然语言处理技术,或在制作移动应用时作为示例行使用数据。
  • Yelp学术.zip
    优质
    该数据集包含来自Yelp平台的企业、用户评价、检查者信息等多维度的数据资源,旨在支持商业智能分析和机器学习研究。 yelp_academic_dataset_business.json、yelp_academic_dataset_review.json 和 yelp_academic_dataset_user.json 这三个文件包含了 Yelp 平台上的商家信息、用户评论以及用户资料等数据,可用于分析和研究相关业务及用户行为模式。
  • Yelp析:与情感析探讨
    优质
    本研究深入探索Yelp数据集,通过详尽的数据分类和情感分析方法,揭示用户评论中的趋势与模式,为商业策略提供有力支持。 这是关于Yelp开放数据集的分类和情感分析的数据分析项目。
  • CV-Yelp图片
    优质
    CV-Yelp图片分类项目旨在通过计算机视觉技术对Yelp平台上的商家图片进行自动分类和标签化,以提升用户体验与搜索效率。 在一天的工作或学习之后,寻找一家符合自己口味的餐厅是放松身心的好方法之一。Yelp应用程序是最知名的搜索食品和餐馆的应用程序之一。该项目的目标是在用户提交的照片(即由Yelp提供的数据集)上为不同的餐厅添加标签。这种自动化的标记将帮助用户更快、更有效地找到他们心仪的餐厅。 项目可以分为两个主要步骤:首先,从训练集中给定的图片中提取特征,并选择有用的特征;其次,在这些基础上构建机器学习模型并对其进行训练以获得更好的结果。与基于ImageNet进行训练的卷积神经网络(CNN)相比,该项目采用了定向梯度直方图(HOG)算法来实现图像中的特征提取,并使用逻辑回归(LR)和支持向量机(SVM)来进行分类。
  • 2017年Yelp更新版
    优质
    2017年Yelp数据集更新版包含了用户评论、商业信息及检查-in记录等大量真实世界的数据,为研究与开发提供宝贵资源。 elp希望更多的学生利用这些数据,在研究中想出创新性方法,并且他们也提供了目前感兴趣的一些主题。一是图片分类:虽然现有的技术能够识别图片中的食物(如汉堡),但如何评价一张图片的美观度仍然是一个待解的问题;二是自然语言处理和情感分析:用户评论中有许多可以挖掘的数据,这些数据可用于推断语义、商户属性以及情感倾向,他们想知道评价里表达了什么情绪,是正面还是负面;三是图像挖掘:例如探究用户之间的关系如何影响他们的使用模式,流行趋势的引导者在一家店火起来之前通常会去哪些地方就餐。
  • SST-EmotionNet: SST-EmotionNet系统
    优质
    SST-EmotionNet是一个先进的情感分析系统,专注于从社交媒体文本中识别和分类情绪。该系统利用深度学习技术,提高对复杂人类情感的理解和处理能力。 SST-EmotionNet是一个用于脑电图情感识别的基于时空光谱的注意力3D密集网络模型。该模型由空间光谱流和时空流组成,每个流包含几个基于注意力机制的3D密集块(A3DB)以及过渡层。 我们在SEED及SEED-IV数据集上对SST-EmotionNet进行了评估。这些数据集中包含了对象在观看特定影片剪辑时产生的脑电信号记录。所选影片剪辑旨在引发积极、消极和中性情绪等不同情感体验。相较于原始的SEED数据集,SEED-IV将情感类别数量调整为四种:快乐、悲伤、恐惧及中立。 为了进行实验,在这些数据集中使用了从脑电图信号提取出的微分熵(DE)特征,并且需要在Python 3.7.7环境中安装CUDA 10.1和CuDNN 7.6.5,同时还要确保numpy版本为1.16.2以及scipy版本为1.x。