
MapReduce的执行流程
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
MapReduce是一种编程模型,用于处理大规模数据集。其执行流程主要包括输入数据分割、Mapper任务映射、Shuffle和Sort过程以及Reducer任务化简四个步骤。
MapReduce的大体流程如下:首先对输入数据源进行切片;master调度worker执行map任务;worker读取输入源片段,并执行map任务,将输出保存在本地;然后master再调度worker来执行reduce任务,此时的reduce worker会读取之前的map任务的输出文件并执行reduce操作,最后把结果保存到HDFS中。从生命周期的角度来看,MapReduce流程主要包括初始化、分配、执行、反馈以及成功与失败后的处理等几个阶段。在每个阶段里主要完成的工作如下:首先进行初始化;然后是资源和任务的分配;接下来就是具体的任务执行过程;之后会有相应的状态反馈机制;最后根据任务的成功或失败情况采取不同的后续操作。
全部评论 (0)
还没有任何评论哟~


