
MapReduce编程示例:单词计数
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本篇教程通过一个经典的“单词计数”案例,介绍了如何使用MapReduce进行分布式数据处理。适合初学者快速掌握MapReduce编程基础。
本节介绍如何编写基本的 MapReduce 程序来实现数据分析。代码基于 Hadoop 2.7.3 开发。单词计数的任务是对一组输入文档中的单词进行分别统计。假设文件数量庞大,每个文档包含大量单词,则无法使用传统的线性程序处理这类问题,而这是 MapReduce 发挥优势的地方。在之前的教程中已经介绍了用 MapReduce 实现单词计数的基本思路和具体执行过程。接下来将介绍如何编写具体的实现代码及如何运行程序。首先,在本地创建三个文件:file001、file002 和 file003,文件的具体内容如下所示。
全部评论 (0)
还没有任何评论哟~


