
深入解析Hadoop核心组件HDFS、MapReduce、HBase与Hive
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本课程详细剖析了Hadoop四大核心技术模块——HDFS、MapReduce、HBase及Hive的工作原理及其应用实践,适合大数据技术学习者参考。
通过对Hadoop分布式计算平台核心组件——分布式文件系统HDFS、MapReduce处理过程以及数据仓库工具Hive和分布式数据库HBase的介绍,基本涵盖了Hadoop分布式平台的技术要点。这一阶段的研究总结从内部机理的角度详细分析了这些技术是如何运行的,并探讨了基于Hadoop的数据仓库构建方法及分布式数据库的具体实现细节。整个Hadoop体系结构主要通过HDFS来支持底层的分布式存储需求,并利用MapReduce程序支持分布式并行任务处理。HDFS采用主从(Master-Slave)结构模型,一个HDFS集群包括一个NameNode和若干DataNode节点。
全部评论 (0)
还没有任何评论哟~


