Advertisement

中文情感分析的数据集 - Sentiment Analysis

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
本数据集专注于构建和优化中文文本的情感分析模型,涵盖广泛的实际应用场景,如社交媒体、产品评论等。 该数据集包含了四个领域的中文评论:笔记本电脑、汽车、相机和手机。这些评论属于二分类任务,即正面或负面的评价。此数据集可用于自然语言处理中的情感分类任务。 文件包括: - camera_label.txt - camera_sentence.txt - car_label.txt - car_sentence.txt - car_target.txt - notebook_label.txt - notebook_sentence.txt - notebook_target.txt - phone_label.txt - phone_sentence.txt - phone_target.txt - camera_target.txt

全部评论 (0)

还没有任何评论哟~
客服
客服
  • - Sentiment Analysis
    优质
    本数据集专注于构建和优化中文文本的情感分析模型,涵盖广泛的实际应用场景,如社交媒体、产品评论等。 该数据集包含了四个领域的中文评论:笔记本电脑、汽车、相机和手机。这些评论属于二分类任务,即正面或负面的评价。此数据集可用于自然语言处理中的情感分类任务。 文件包括: - camera_label.txt - camera_sentence.txt - car_label.txt - car_sentence.txt - car_target.txt - notebook_label.txt - notebook_sentence.txt - notebook_target.txt - phone_label.txt - phone_sentence.txt - phone_target.txt - camera_target.txt
  • Stock Market Tweet Sentiment Analysis Using Lexicon(使用词典进行股市推)- ...
    优质
    本研究采用Lexicon方法对Twitter上的股票市场相关推文进行情感分析,旨在评估公众情绪对股市的影响。通过数据挖掘和自然语言处理技术,提取并量化推文中蕴含的情感倾向,为投资者提供潜在的决策支持工具。 在2020年4月9日至7月16日之间收集了推文数据,不仅使用SPX500标签,还涉及指数前25名公司以及“#stocks”标签。引用来源为:布鲁诺·塔博达、安娜·德阿尔梅达、何塞·卡洛斯·迪亚斯、费尔南多·巴蒂斯塔和里卡多·里贝罗(2020),《股票市场推文词典数据》,Mendeley 数据,V1, doi: 10.17632/hfd7787h7j.1。收集的文件包括tweets_labelled_09042020_16072020.csv 和 tweets_remaining_09042020_16072020.csv。
  • 项目(基于机器学习sentiment-analysis)。
    优质
    本项目运用机器学习技术进行情感分析,旨在通过训练模型识别和理解文本中的正面、负面或中立情绪,服务于社交媒体监测、市场调研等领域。 情感分析的目标是使用机器学习技术来确定文本的情感极性(正向、中立或负面)。通过训练模型识别带有情感标签的样本数据集,可以教会机器自动检测新文本中的情感倾向而无需人工干预。 项目结构如下: - 步骤a:导入所需库和数据。 - 步骤b:进行文本规范化处理。 - 步骤c:执行归类化操作。 - 步骤d:对数据进行预处理以准备模型训练。 - 步骤e:构建并训练情感分析模型,使用的算法包括线性回归、决策树分类器、随机森林分类器、K近邻分类器和支持向量机(SVM)。
  • Sentiment Analysis Amazon Reviews
    优质
    该数据集包含了从Amazon网站收集的产品评论,旨在用于情感分析研究,帮助研究人员和开发者理解和评估消费者对产品的态度与感受。 该数据集包含数百万条Amazon客户评论(作为输入文本)及其对应的星级评分(输出标签),旨在用于训练fastText模型进行情感分析。这个数据集不仅规模适中、贴近真实业务场景,而且可以在普通的笔记本电脑上几分钟内完成训练任务。 文件名为:Amazon Reviews for Sentiment Analysis_datasets.zip
  • 优质
    本数据集专为研究中文文本的情感倾向分析而设计,包含丰富多样的标注评论和评分,涵盖多个领域,旨在促进自然语言处理技术的发展。 中文情感分析语料库包含酒店、服装、水果、平板、洗发水五个领域的评价数据,每个领域各包括5000条正面和负面的评论。这些数据是从携程网和京东抓取而来,仅供科研学习使用,欢迎下载使用。
  • 优质
    中文情感分析数据集是一套包含丰富标注信息的数据集合,旨在帮助研究者和开发者训练并测试文本中蕴含的情感倾向性分析模型。该数据集广泛应用于产品评论、社交媒体等场景,助力企业更好地理解用户反馈及市场趋势。 该资源涵盖了计算机、酒店、蒙牛、热水器、手机以及书籍等多个领域,并且已经按照类别进行了细分并添加了标签。总共大约有30,000条记录。此外还包括搜狗新闻分类和tr-croup-answer内容。
  • sentiment analysis
    优质
    中文中的情感分析是指利用自然语言处理和机器学习技术来识别、提取并量化文本中所包含的情感倾向,如正面、负面或中立情绪。这项研究对于理解公众意见及市场趋势具有重要意义。 该数据集包含了四个领域的中文评论:笔记本电脑、汽车、相机和手机。这些评论适用于自然语言处理中的情感分类任务,并且是二分类任务,即正面或负面的评价。
  • 评论
    优质
    本数据集包含大量针对各类中文文本资料(如电影、产品等)的用户评论及其对应情感标签,旨在支持自然语言处理中情感分析的研究与应用。 谭松波的中文评论情感分析结果为:1表示正向情感,0表示负向情感。