【Hadoop】三分钟快速了解Hadoop

news/2024/5/20 4:09:12 标签: hadoop, 分布式, HDFS, MapReduce

一·Hadoop初见

  1. Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储
  2. Hadoop的核心是:分布式文件系统HDFS + 分布式计算模型MapReduce
  3. Hadoop基于Java,具有很好的跨平台性
  4. Hadoop的设计就是为了部署在低廉的计算机集群中
  5. 开源

 

二·Hadoop发展与现状

  1. Hadoop本来只是Apache的子项目,2008年它成为Apache顶级项目,一年后它把1TB数据的排序时间缩短到62秒,从此名声大振
  2. 现如今,Hadoop已得到广泛应用,并将互联网领域作为其主要阵地。国外的脸书,国内的华为、百度、淘宝都采用了Hadoop

 

三·Hadoop特性

  1. 高可靠性
  2. 高容错性
  3. 高可扩展性
  4. 成本低
  5. 运行在Linux平台
  6. 支持多种编程语言

 

四·Hadoop项目结构

在这里插入图片描述
在这里插入图片描述
 

 

 

 

 


http://www.niftyadmin.cn/n/1330367.html

相关文章

【HDFS】Hadoop的分布式文件系统知识点总结

>_< 首先&#xff0c;我们需要从整体上了解什么是分布式文件系统 >_<。 分布式文件系统把文件存储到多个计算机节点上&#xff0c;成千上万的计算机节点构成计算机集群。 计算机集群听着高大上&#xff0c;其实是由普通廉价硬件组成&#xff0c;硬件开销是极低的…

键盘有毒(STL() || 数组模拟双向链表)

ACM汇总学习:https://blog.csdn.net/weixin_39778570/article/details/83187443 Broken Keyboard 题目&#xff1a;https://vjudge.net/problem/UVA-11988 Sample Input This_is_a_[Beiju]_text [[]][][]Happy_Birthday_to_Tsinghua_University Sample Output BeijuThis_is_a__…

【计组3.5】双端口RAM和多模块存储器

第三章——存储系统 3.1 半导体存储器RAM 3.2 半导体存储器ROM 3.3 存储器基本概念 3.4 主存与CPU的连接 3.5 双端口RAM和多模块存储器 3.6 高速缓冲存储器Cache 3.7虚拟存储器

UVA - 12657(双向链表,左插入,右插入,交换,翻转)

Boxes in a Line ACM汇总学习:https://blog.csdn.net/weixin_39778570/article/details/83187443 题目&#xff1a;https://vjudge.net/problem/UVA-12657 题目&#xff1a;模拟链表4中操作&#xff0c;x左插入y&#xff0c;x右插入y&#xff0c;x交换y&#xff0c;翻转链表&am…

【计组4.1】指令格式

第四章——指令系统 4.1 指令格式 4.2 指令的寻址方式 4.3 CISC和RISC的基本概念

Princess Principal(多括号匹配,区间合法查询)

ACM题集&#xff1a;https://blog.csdn.net/weixin_39778570/article/details/83187443 Princess Principal 题目&#xff1a;https://ac.nowcoder.com/acm/contest/201/J 题意&#xff1a;使用数组代表括号&#xff0c;0,1为一对左右括号&#xff0c;1,2为另一对&#xff0c;3…

【计组4.2】指令的寻址方式

第四章——指令系统 4.1 指令格式 4.2 指令的寻址方式 4.3 CISC和RISC的基本概念

【计组4.3】CISC和RISC的基本概念

第四章——指令系统 4.1 指令格式 4.2 指令的寻址方式 4.3 CISC和RISC的基本概念