Hadoop三剑客

news/2024/5/20 1:15:45 标签: hadoop, hdfs, big data

文章目录

  • Hadoop三剑客
    • 1、HDFS:Hadoop的文件操作系统
      • 1.NameNode
      • 2.DataNode
      • 3.Secondary NameNode
    • 2、MapReduce:Hadoop支持的计算框架
      • 1.Map
      • 2.Reduce
    • 3、Yarn:资源调度框架
      • 1.ResourceManager(RM)
      • 2.NodeManager(NM)
      • 3.ApplicationMaster(AM)
      • 4.Container

Hadoop三剑客

1、HDFS:Hadoop的文件操作系统

HDFS主要是基于谷歌GFS演变过来的,主要实现数据的存储和管理

请添加图片描述

1.NameNode

NameNode主要存储文件的元数据 、每个文件的块列表块所在的DataNode

  1. 元数据: 元数据是描述数据的数据,包括有:文件名、文件目录结构、文件属性(生产时间、副本数和文件权限)

  2. 块列表: FileSystem的文件系统,通过这个文件系统可以查找到文件所在目录

  3. 块所在的DataNode: 查找文件所在分片数

2.DataNode

DataNode主要存储数据块数据的校验和

  1. 数据: 数据是本数据节点的最主要功能

  2. 块数据的校验和: 通过数据校验对数据进行校验,进而提高文件的容错性

3.Secondary NameNode

在一定的时间间隔对NameNode的元数据进行备份,当NameNode挂了本节点可以直接热启动,继续保证集群运转

2、MapReduce:Hadoop支持的计算框架

Hadoop集群通过分布式存储方式,对一个数据进行分片后进行存储。当这些数据需要进行运算处理,如果将分布式数据进行合并计算,其集群的使用效率很低,且对内部局域网络的负荷也很大。为了提高集群的运算能力,将存储节点和运算节点合并,进而让每个存储节点都拥有一定的运算能力。

请添加图片描述

1.Map

Map阶段并行处理输入数据,节点内部将存储在该节点的数据进行运算,之后通过网络对处理后的进行传输。

2.Reduce

Reduce阶段对Map结果进行汇总,Map处理的数据到Reduce合并的过程中采取归并排序,因为经过Map处理的数据已经有序,采取归并排序其时空复杂度最低。

3、Yarn:资源调度框架

Apache Hadoop YARN 是开源 Hadoop 分布式处理框架中的资源管理和作业调度技术。作为 Apache Hadoop 的核心组件之一,YARN 负责将系统资源分配给在 Hadoop 集群中运行的各种应用程序,并调度要在不同集群节点上执行的任务。

请添加图片描述

1.ResourceManager(RM)

(1)处理客户端请求

(2)监控NodeManager

(3)启动或者监控ApplicationMaster

(4)资源的分配与调度

2.NodeManager(NM)

(1)管理单个节点上的资源

(2)处理来自ResourceManager的命令

(3)处理来自ApplicationMaster的命令

3.ApplicationMaster(AM)

(1)负责数据的切分

(2)为应用程序申请资源并分配给内部的任务

(3)任务的监控与容错

4.Container

Container是Yarn中的资源抽象,它封装了某个节点上的多维度资源,包括:内存、CPU、磁盘、网络等。


http://www.niftyadmin.cn/n/1616088.html

相关文章

伟大领袖乔布斯,指引我们向前进

再过几天,用户将拿到新一期的《快公司》杂志。本期杂志有四个不同版本的封面,其中一个就是史蒂夫乔布斯。但这不是一个纪念讣文,事实上,在乔布斯去世前我们已经开始印刷这个封面了。 相反,这期杂志对苹果下一步如何与A…

HDOJ 2036

Input 输入数据包含多个测试实例&#xff0c;每个测试实例占一行&#xff0c;每行的开始是一个整数n(3<n<100)&#xff0c;它表示多边形的边数&#xff08;当然也是顶点数&#xff09;&#xff0c;然后是按照逆时针顺序给出的n个顶点的坐标&#xff08;x1, y1, x2, y2… …

Hadoop服务开启与关闭及其源码介绍

文章目录Hadoop的服务开启与关闭1、开启关闭所有服务&#xff08;不推荐&#xff09;1.命令使用2.start-all.sh脚本3.stop-all.sh2、开启Hadoop所有服务★★★1.命令使用2.start-dfs.sh3.start-yarn.sh3、关闭Hadoop所有服务★★★1. 命令使用2.stop-dfs.sh3.stop-yarn.sh4、利…

正正得负?音效合成应用Talkapella

小编曾经在上周的《iOS语音应用盘点》介绍过 一款将录音进行变声效果转换的应用“Voice Morph Pro”&#xff0c;这次介绍的这款Talkapella则是一款和它很接近的应用&#xff0c;你可以在这款应用里录下你的声音然后选择音轨混合出各种效果的音乐&#xff0c;看起来是挺酷的应用…

HDOJ 2032

Problem Description 还记得中学时候学过的杨辉三角吗&#xff1f;具体的定义这里不再描述&#xff0c;你可以参考以下的图形&#xff1a; 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 Input 输入数据包含多个测试实例&#xff0c;每个测试实例的输入只包含一个正整数n&…

hadoop的HDFS的shell命令大全(一篇文章就够了)

文章目录HDFS的shell命令1、安全模式1.查看安全模式状态2.手工开启安全模式状态3.手工关闭安全模式状态2、文件操作指令1.查看文件目录2.查看文件夹情况3.文件操作4.上传文件5、获取文件6.查看文件内容7.创建目录8.修改副本数量9.创建空白文件&#xff08;不推荐使用&#xff0…

HDOJ 2099

Problem Description 一个整数&#xff0c;只知道前几位&#xff0c;不知道末二位&#xff0c;被另一个整数除尽了&#xff0c;那么该数的末二位该是什么呢&#xff1f; Input 输入数据有若干组&#xff0c;每组数据包含二个整数a&#xff0c;b&#xff08;0<a<10000, 1…

SPB Shell 3D:打造最酷3D效果的Android界面

Android的魅力在于其开放性&#xff0c;与iPhone的千人一面相比&#xff0c;Android用户则可以用各种应用装扮爱机&#xff0c;彰显个性&#xff0c;其中能让用户自定义系统界面的应用&#xff0c;比如ADW、LauncherPro、Go桌面更是大受欢迎。不过&#xff0c;说起这类应用&…