
Hadoop朴素贝叶斯:基于Apache Hadoop的项目
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目为基于Apache Hadoop的大数据环境下的朴素贝叶斯算法实现,适用于大规模文本分类与情感分析等场景。
该项目在Hadoop上实现了一个朴素贝叶斯分类器,并使用UCI存储库中的“Cencus Income”数据集进行测试。该数据集包含有关某些人收入预测的信息,可以从相关网站下载(特别是文件adult.data)。对于此项目,在预处理阶段,我们针对数字属性在Hadoop上利用MapReduce实现了离散化过程。
全部评论 (0)
还没有任何评论哟~


