AI Challenger 2018细粒度用户评论情感分析数据集是专为自然语言处理领域设计的大规模中文数据集,旨在促进机器学习算法在理解和分析复杂人类情绪方面的研究与应用。
AI Challenger 2018 细粒度用户评论情感分析数据集的训练集包括文件sentiment_analysis_trainingset.csv,该文件包含总共105,000条评论的数据。另外还有一个名为sentiment_analysis_trainingset_annotations.docx 的文档用于解释这些数据的标注规则。
验证集则由sentiment_analysis_validationset.csv 文件构成,其中包含了总计15,000条评论的数据,并且有一个相应的注释文档sentiment_analysis_validationset_annotations.docx 以说明其标注细节。所有文件都遵循protocol.txt 中规定的下载协议进行分发和使用。
测试集中包括了名为sentiment_analysis_testa.csv 的数据集A,里面也有总计15,000条评论的数据,并同样需要遵守protocol.txt 文件中的规定来获取并操作这些资源。