
Hadoop实现WordCount词频统计及倒排索引
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目通过Hadoop平台实现了经典示例WordCount程序,用于进行大规模文本数据集中的单词频率统计,并进一步构建了高效的倒排索引系统。
这是我的一些Hadoop课程的程序示例,包括最基本的WordCount、倒排索引以及对倒排索引进行排序的代码。使用的数据是Hadoop课程中提供的武侠小说的数据。
全部评论 (0)
还没有任何评论哟~


简介:
本项目通过Hadoop平台实现了经典示例WordCount程序,用于进行大规模文本数据集中的单词频率统计,并进一步构建了高效的倒排索引系统。
这是我的一些Hadoop课程的程序示例,包括最基本的WordCount、倒排索引以及对倒排索引进行排序的代码。使用的数据是Hadoop课程中提供的武侠小说的数据。


