
情感分析语料的整理。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
# 语料库说明------------------------------------------------------------------------
## 词典列表:
## 1、HowNet情感词典
## 2、ntusd情感词典
## 3、情感分析停用词表
## 4、结巴分词自定义词典
## 5、包含常用语词汇的词典,涵盖流行新词、网络流行语、手机术语、粤语方言以及阿里巴巴通讯产品相关的词汇。
## 手机评论数据:
## 1、HTC手机评论数据集,包含打分信息,总计302篇,评分为1到5星。
## 2、魅族手机评论数据集,同样包含打分信息,总共529篇,评分为1到5星。
## 3、诺基亚手机评论数据集,也提供打分信息,总计614篇,评分为1到5星。
## 4、OPPO手机评论数据集,包括打分(1到5星),总共553篇。
## 5、三星手机评论数据集,同样包含打分(1到5星),总计762篇。
## 6、中兴手机评论数据集,提供打分(1到5星),总共785篇。
## 7、摩托罗拉手机评论数据集,包含打分(1到5星),总计990篇。
## 8、整合后的数据集中正面评价共计1084篇,负面评价则为524篇。
## 淘宝商品评论数据:
## 1、包含一万篇正面评价和一万篇负面评价的数据集。
## 2、此外还包括一万篇待预测的语料数据。
## 2012微博情感分析数据:该数据集基于腾讯微博平台收集而来,共包含三个任务:
## 1.观点句与非观点句的判别任务;
## 2.情感分类任务;以及
## 3.情感要素抽取任务。每个话题包含约一千条微博,总计两万条微博。
## 谭松波酒店评论语料正负样本不平衡:正向样本数量为7000条,负向样本数量为3000条,因此总样本数为10,000条。
## 此外还包括酒店、服装、水果等商品类别正负样本各5,000条数据, 总样本数达到50,000条 。
全部评论 (0)


