
ChnSentiCorp酒店评论中文情感分析语料
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
ChnSentiCorp酒店评论中文情感分析语料是一份包含大量中国酒店客户评价的数据集,专门用于训练和评估自然语言处理模型在识别和分类文本情感方面的能力。该数据集对于理解顾客满意度及进行市场趋势分析具有重要价值。
谭松波收集并整理了一个包含10000篇评论的酒店评价语料库。这些数据是从携程网站自动采集而来,并经过细致处理形成最终版本。为了便于研究,该语料被划分为四个子集:1. ChnSentiCorp-Htl-ba-2000: 包含正负两类各1000篇的平衡语料;2. ChnSentiCorp-Htl-ba-4000: 正负类各2000篇,同样为平衡语料;3. ChnSentiCorp-Htl-ba-6000: 包含正负两类各3000篇的平衡语料;4. ChnSentiCorp-Htl-unba-10000: 正类有7000篇,构成非平衡语料。
全部评论 (0)
还没有任何评论哟~


