
酒店评价语料库,用于收集和分析顾客对酒店服务的反馈。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
为了克服国内中文情感分析领域数据稀缺的问题,谭松波精心收集并构建了一个更为庞大的酒店评论数据集。该数据集的总规模达到了10000篇评论。这些评论信息是通过从携程网站上自动抓取,并随后进行仔细整理而获得的。为了便于后续使用和研究,该数据集被进一步划分为四个独立的子集:首先,ChnSentiCorp-Htl-ba-2000包含着平衡的语料,其中正面情感和负面情感的评论数量均为1000篇;其次,ChnSentiCorp-Htl-ba-4000同样提供了平衡的语料,正面和负面情感的样本数量分别达到了2000篇;第三,ChnSentiCorp-Htl-ba-6000则包含了平衡的语料,正面情感和负面情感的篇幅为3000篇;最后,ChnSentiCorp-Htl-unba-10000提供了非平衡的数据集,主要集中于正面情感的7000篇评论。
全部评论 (0)
还没有任何评论哟~


