
Hadoop是由Apache基金会开发的一种分布式系统基础架构.docx
5星
- 浏览量: 0
- 大小:None
- 文件类型:DOCX
简介:
本文档探讨了由Apache基金会研发的Hadoop,一种用于处理大规模数据集、支持高容错性和灵活扩展能力的分布式计算框架。
Hadoop是由Apache基金会开发的一种分布式系统基础架构,主要用于处理大规模数据集,并提供高可靠性、高可扩展性和高效性等特点。
一、Hadoop的概述
定义:Hadoop是一个开源的分布式计算平台,用户可以在不了解底层细节的情况下编写分布式程序,充分利用集群进行高速运算和存储。
核心组件:Hadoop主要由三个部分构成,包括HDFS(Hadoop Distributed File System)、MapReduce以及YARN(Yet Another Resource Negotiator)。
起源:Hadoop起源于Apache Nutch项目。该项目始于2002年,并且是Apache Lucene的一个子项目之一。到了2006年,NDFS和MapReduce从Nutch中分离出来并被命名为Hadoop,成为一个完整独立的软件系统。
二、Hadoop的核心组件
HDFS(Hadoop Distributed File System)
功能:作为Hadoop集群中的基本段落件系统,HDFS提供了高扩展性、高容错性和机架感知等特性。
全部评论 (0)
还没有任何评论哟~


