从零开始的Hadoop学习(二)| Hadoop介绍、优势、组成、HDFS架构

news/2024/5/20 3:09:16 标签: hadoop, 学习, hdfs

1. Hadoop 是什么

  • Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
  • 主要解决,海量数据的存储和海量数据的分析计算问题。
  • 广义上来说,Hadoop通常是指一个更广泛的概念—Hadoop生态圈。

2. Hadoop 的优势

  • 高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。
  • 高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。
  • 高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务粗粒速度。
  • 高容错性:能够自动将失败的任务重新分配。

3. Hadoop 组成(面试重点)

在这里插入图片描述

4. HDFS 架构概述

HDFS(Hadoop Distributed File System)的架构概述。
在这里插入图片描述

  • NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。
  • DataNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和。
  • Secondary NameNode(2nn):用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照。

5. YARN架构

在这里插入图片描述

  • ResourceManager(RM):整个集群资源(内存、CPU等)的老大。
  • NodeManager(NM):单个节点服务器资源老大。
  • ApplicationMaster(AM):单个任务运行的老大。
  • Container:容器,相当于一台独立的服务器,里面封装了任务运行所需要的资源,如内存、CPU、磁盘、网络等。

6. MapReduce 架构

MapReduce将计算过程分为两个阶段:Map和Reduce

1)Map阶段并行处理输入数据

2)Reduce阶段对Map结果进行汇总
在这里插入图片描述

7. 大数据技术生态体系

在这里插入图片描述


http://www.niftyadmin.cn/n/4967467.html

相关文章

Java爬虫下载网页图片

在Java中&#xff0c;可以使用HttpURLConnection&#xff0c;Jsoup等库来实现网页爬取和图片下载。下面是一个基本的例子&#xff1a; 首先&#xff0c;需要添加Jsoup库到你的项目中。如果你使用Maven&#xff0c;可以在你的pom.xml文件中添加以下依赖&#xff1a; xml <…

【精品】vue3 父控件远程获取数据,在子组件上显示不出来

如果在 Vue 3 中父组件通过远程获取数据&#xff0c;而子组件无法显示这些数据&#xff0c;通常是因为数据传递或渲染的时机不正确&#xff0c;或者数据还未完全加载就已经渲染子组件。以下是可能的解决方案&#xff1a; 确保数据加载完成后再渲染子组件&#xff1a;如果父组件…

vue3 05-语法糖以及小案例

setup语法糖 srcipt setup的标签中,属性数据和函数,模板可以直接使用 这是setup语法糖 <template><div> </div> </template> <script setup></script>怎么使用这个setup函数的语法糖(小案例) <template><div><p>set…

Solidity 合约安全,常见漏洞(第三篇)

Solidity 合约安全&#xff0c;常见漏洞&#xff08;第三篇&#xff09; ERC20 代币问题 如果你只处理受信任的 ERC20 代币&#xff0c;这些问题大多不适用。然而&#xff0c;当与任意的或部分不受信任的 ERC20 代币交互时&#xff0c;就有一些需要注意的地方。 ERC20&#…

更改Docker的存储位置

要更改Docker的存储位置&#xff0c;可以按照以下步骤进行操作 文章目录 停止Docker服务编辑Docker配置文件 /etc/docker/daemon.json保存并关闭配置文件,并服务程序配置文件生效移动现有的Docker数据目录到新的存储路径更新文件权限以确保Docker可以访问新的数据目录启动Dock…

设计模式二十三:模板方法模式(Template Method Pattern)

定义了一个算法的框架&#xff0c;将算法的具体步骤延迟到子类中实现。这样可以在不改变算法结构的情况下&#xff0c;允许子类重写算法的特定步骤以满足自己的需求 模版方法使用场景 算法框架固定&#xff0c;但具体步骤可以变化&#xff1a;当你有一个算法的整体结构是固定…

软考高级系统架构设计师系列论文九十七:论软件三层结构的设计

软考高级系统架构设计师系列论文九十七:论软件三层结构的设计 一、软件结构相关知识点二、摘要三、正文四、总结一、软件结构相关知识点 软考高级系统架构设计师:软件架构设计系列二二、摘要 随着中间件与Web技术的发展,三层或多层分布式应用体系越来越流行。在这种体系结构…

Java与Modbus-TCP/IP网络通讯

1.需求样例 举例5&#xff1a;浮点数参数读取&#xff08;读取温度测量值&#xff09;查看参数列表&#xff0c;温度测量值地址为320&#xff0c;根据Modbus协议&#xff0c;读取参数地址转换为16进制为&#xff1a;00H A0H&#xff0c;读取长度为2个字&#xff1a;00H 02H。 …