一·Hadoop初见
- Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。
- Hadoop的核心是:分布式文件系统HDFS + 分布式计算模型MapReduce
- Hadoop基于Java,具有很好的跨平台性
- Hadoop的设计就是为了部署在低廉的计算机集群中
- 开源
二·Hadoop发展与现状
- Hadoop本来只是Apache的子项目,2008年它成为Apache顶级项目,一年后它把1TB数据的排序时间缩短到62秒,从此名声大振
- 现如今,Hadoop已得到广泛应用,并将互联网领域作为其主要阵地。国外的脸书,国内的华为、百度、淘宝都采用了Hadoop
三·Hadoop特性
- 高可靠性
- 高容错性
- 高可扩展性
- 成本低
- 运行在Linux平台
- 支持多种编程语言
四·Hadoop项目结构