Advertisement

Yelp学术数据集.zip

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该数据集包含来自Yelp平台的企业、用户评价、检查者信息等多维度的数据资源,旨在支持商业智能分析和机器学习研究。 yelp_academic_dataset_business.json、yelp_academic_dataset_review.json 和 yelp_academic_dataset_user.json 这三个文件包含了 Yelp 平台上的商家信息、用户评论以及用户资料等数据,可用于分析和研究相关业务及用户行为模式。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Yelp.zip
    优质
    该数据集包含来自Yelp平台的企业、用户评价、检查者信息等多维度的数据资源,旨在支持商业智能分析和机器学习研究。 yelp_academic_dataset_business.json、yelp_academic_dataset_review.json 和 yelp_academic_dataset_user.json 这三个文件包含了 Yelp 平台上的商家信息、用户评论以及用户资料等数据,可用于分析和研究相关业务及用户行为模式。
  • Yelp.zip
    优质
    Yelp数据集包含来自Yelp平台的各种用户评论、企业信息和用户资料等大数据资源,适用于数据分析、机器学习模型训练及自然语言处理研究。 Yelp数据集是我们业务、评论和用户数据的一个子集,可用于个人、教育和学术目的。该数据集以JSON文件形式提供,可以用于教授学生数据库知识,学习自然语言处理技术,或在制作移动应用时作为示例行使用数据。
  • Yelp 2015年的情感分析
    优质
    本研究使用Yelp 2015年的公开学术数据集进行情感分析,旨在通过机器学习方法识别和分类评论中的正面与负面情绪。 Yelp2015 Yelp学术数据集的情感分析涉及对大量用户评论进行研究,以理解消费者情绪和偏好。这项工作可以帮助企业更好地了解市场反馈,并据此优化产品和服务。通过对这些数据的深入挖掘,研究人员能够提取有价值的见解,从而促进商业决策和发展策略的制定。
  • Yelp挑战:Yelp竞赛
    优质
    Yelp挑战赛基于庞大的Yelp数据集,旨在通过数据分析和机器学习技术来解决实际商业问题,吸引全球的数据科学爱好者参与。 Yelp挑战(美食家挑战)是基于Yelp数据集的自然语言处理项目。该项目使用了来自美国各地用户在Yelp上发布的餐厅评论以及注册餐厅的信息。我选择了2016年至2018年的评论进行模型训练和测试,原始数据总量约为1GB。 整个项目分为三个主要部分: - 数据预处理 - 自然语言处理与情绪分析(使用朴素贝叶斯分类器) - 推荐系统
  • Yelp分析
    优质
    本项目通过对Yelp数据集进行深入分析,探索用户评价、商家分布及社交网络特征,旨在挖掘本地商业市场的潜在规律和趋势。 Yelp数据集可以用于构建推荐系统。该数据集包含了丰富的用户评价、商家信息等内容,非常适合用来开发高效的推荐算法和服务。
  • 2017年Yelp更新版
    优质
    2017年Yelp数据集更新版包含了用户评论、商业信息及检查-in记录等大量真实世界的数据,为研究与开发提供宝贵资源。 elp希望更多的学生利用这些数据,在研究中想出创新性方法,并且他们也提供了目前感兴趣的一些主题。一是图片分类:虽然现有的技术能够识别图片中的食物(如汉堡),但如何评价一张图片的美观度仍然是一个待解的问题;二是自然语言处理和情感分析:用户评论中有许多可以挖掘的数据,这些数据可用于推断语义、商户属性以及情感倾向,他们想知道评价里表达了什么情绪,是正面还是负面;三是图像挖掘:例如探究用户之间的关系如何影响他们的使用模式,流行趋势的引导者在一家店火起来之前通常会去哪些地方就餐。
  • IMDb、SST-1、SST-2、Yelp-2013、Yelp-2014文本分类
    优质
    本数据集包含IMDb电影评论及SST-1/2与Yelp-2013/2014的用户评价,适用于训练和评估情感分析中的文本分类模型。 IMDb、SST-1、SST-2、yelp-2013 和 yelp-2014 是用于文本分类的数据集。这些数据集可以在 GitHub 上找到,具体地址为 https://github.com/JerrikEph/Capsule4TextClassification/blob/master/data/downloadDataset.md 。
  • Yelp用户评论极性.7z
    优质
    本数据集包含Yelp平台上的用户评论文本及对应的正面或负面情绪标签,用于训练和评估情感分析模型。 Yelp Reviews Polarity Dataset 发布于 2015 年,包含共计 1,569,264 个样本。该子集中不同极性的训练样本有 280,000 个,测试样本有 19,000 个。
  • Yelp_Dataset_Analysis:对Yelp进行的大分析
    优质
    本项目是对Yelp数据集进行的大规模分析研究,旨在挖掘商业评论和用户行为中的模式与趋势,为商家提供优化策略建议。 这是对Yelp数据集进行的大数据分析项目。由于数据集超过3GB,我无法在此处直接提供该数据集。不过,我已经将我的ipynb文件上传了,并且您可以通过下载提供的数据集并使用此ipynb文件来运行分析。此外,“数据集”文件夹列表中的其他一些文件的工作正在进行中。
  • Yelp评论评分预测:基于LDA、TF-IDF及机器习模型的Yelp挑战解决方案
    优质
    本文探讨了运用LDA和TF-IDF技术结合多种机器学习算法来解决Yelp数据集上的商业评论与评分预测问题,提供了一个全面的数据分析解决方案。 该项目的目标是通过分析评论文本预测Yelp上的星级评分。我们构建了几个模型来进行这项工作: 1. 基准模型:该模型假设所有评论的评级为3星。 2. 词频模型:此模型利用单词出现频率来预测评论等级。 3. LDA + 情感模型:通过使用潜在狄利克雷分配(LDA)和情感分析,从文本中提取主题与情绪信息以预测评分。 4. NMF + 情感模型:该方法采用非负矩阵分解(NMF),结合情感层来识别评论中的相关话题及情绪,并据此进行星级预测。 我们的评估结果显示,在评价评论星级时达到了61%的准确率。代码文件主要为IPython笔记本格式,扩展名为.ipynb,同时使用了Python 2.7、NumPy、Pandas以及scikit-learn等模块。