
ChnSentiCorp-Htl-ba-4000数据集采用平衡语料—改良版。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
利用【谭松波ChnSentiCorp-Htl-ba-4000:平衡语料,正负类各2000篇】的【优化版本】语料库进行研究。该原始语料库中存在大量重复性评论、无效评论,以及由于分类错误而导致的评论混淆,这些因素均对分类模型的性能评估产生了不利影响。为了提升模型质量,本语料库包含了全部4000条评论,并经过了详尽的人工校对和处理,该过程耗时三天。这些经过精心整理的数据被用于训练模型,从而显著提高了模型的效果。
全部评论 (0)
还没有任何评论哟~


