
该数据集包含IMDB影评文本,并利用神经网络进行文本分类。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
aclIMDB_v1是一个庞大的电影评论数据集,由斯坦福大学提供。它囊括了50,000条电影评论,其中负面评论占总量的50%,正面评论则占剩余的50%。为了便于模型训练和评估,该数据集被细分为训练集和验证集,每个子集都包含了25,000条评论,并保持了正面和负面评论的均衡比例。此外,数据集还包含5,000条未标注的影评,以供进一步研究。值得一提的是,rt-polaritydata是一个已预处理过的单词包,同样来自IDMB的整理,其规模相对较小,通过标点符号进行分隔,并且所有文本均已转换为小写形式。该数据集包含10,662条电影评论,这些评论呈现出半正半负的分布情况。每一行数据都代表着一篇简短而精炼的电影评论。
全部评论 (0)
还没有任何评论哟~


