
Kaggle电影评论分析:运用NLTK、Sci-Kit与Weka分类器开展情感研究
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目利用Python库NLTK和Sci-Kit及Weka工具对Kaggle平台上的电影评论数据进行情感分析,采用多种分类算法探究公众情绪倾向。
本段落介绍了使用NLTK库和Sci-Kit学习器对Kaggle电影评论数据集进行情感分析的方法,并且还探讨了Weka分类器的应用。目标是通过基本的分类算法预测评论的情感,同时调整不同的参数以比较结果。
该数据集源自庞氏和李氏创建的原始电影评论语料库,这些评论来自Rotten Tomatoes网站,后来也被用于Kaggle竞赛中。具体而言,“train.tsv”文件包含了短语及其对应的情绪标签。“test.tsv”则仅包含短语的功能集合。
功能集合包括字母组合特征(词包)、双字、否定词汇以及基于词性标注的特征等。此外还使用了基于情感词典的特性,如LIWC意见词典和主观性词典。
在分类器算法方面,本段落介绍了基于NLTK库的一些方法:朴素贝叶斯、广义迭代缩放和改进迭代缩放算法,并且也探讨了Sci-Kit学习器中的相关模型。
全部评论 (0)
还没有任何评论哟~


