
山东大学大数据实验二:Java实现倒排索引算法
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本实验为山东大学数据结构课程系列之二,主要内容是运用Java语言编程实现高效的文本搜索技术——倒排索引算法,增强学生在实际应用中的数据处理能力。
山东大学大数据课程的实验二要求在Hadoop集群系统(也可以在伪分布式系统上运行)中使用Java编写倒排索引实现,并具有停词表功能以及正则表达式选择规范单词的功能。代码重构了setup()、map()、combiner()、partition()和reducer()函数,其目的是对文档进行倒排索引处理,最终得到一个按照单词顺序排列且每个单词对应的文件列表也有序的倒排列表集合。
全部评论 (0)
还没有任何评论哟~


