Linux(centos7)部署hadoop集群

news/2024/5/20 4:51:43 标签: linux, hadoop, 运维, 集群部署, hdfs, mapreduce, yarn

部署环境要求:已完成JDK环境部署、配置完成固定IP、SSH免费登录、防火墙关闭等。

1、下载、上传主机
官网:https://hadoop.apache.org
在这里插入图片描述
2、解压缩、创建软连接
解压:

tar -zxvf hadoop-3.3.6.tar.gz

软连接:

ln -s /usr/local/apps/hadoop-3.3.6 hadoop

3、文件配置
hadoop目录结构
在这里插入图片描述
各个文件夹含义如下:
bin:存放Hadoop的各类程序(命令)
etc:存放Hadoop的配置文件
include:C语言的一些头文件
lib:存放Linux系统的动态链接库(so文件)
libexec :存放配置Hadoop系统的脚本文件(.sh和.cmd)
licenses-binary:存放许可证文件
sbin:管理员程序(super bin)
share:存放二进制源码(Java jar包)

配置集群,主要修改以下几个配置:
workers:配置从节点(DataNode)有哪些
hadoop-env.sh:配置Hadoop的相关环境变量
core-site.xml:Hadoop核心配置文件
hdfs-site.xml:HDFS核心配置文件
这些文件均存放在$HADOOP_HOME/etc/hadoop文件夹中。

配置workers:

vim etc/hadoop/workers

修改:

# 配置从节点DataNode
node1
node2
node3

配置hadoop-env.sh:

vim etc/hadoop/hadoop-env.sh 

在文件最下面追加配置:

# Supplemental options for privileged registry DNS
# By default, Hadoop uses jsvc which needs to know to launch a
# server jvm.
# export HADOOP_REGISTRYDNS_SECURE_EXTRA_OPTS="-jvm server"

# 配置hadoop相关环境变量
export JAVA_HOME=/usr/local/apps/jdk # java环境路径
export HADOOP_HOME=/usr/local/apps/hadoop # hadoop安装路径
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop # hadoop配置文件路径
export HADOOP_LOG_DIR=$HADOOP_HOME/logs # 指明hadoop运行日志路径

配置core-site.xml:

vim etc/hadoop/core-site.xml

修改:

<!-- 
   设置默认的文件系统,此配置指定了HDFS Namenode的服务地址和端口,
   在本例中,Namenode运行在名为node1的服务器的8020端口上。
   设置Hadoop I/O操作的缓冲区大小,单位是字节。
   较大的缓冲区可以减少磁盘I/O次数,可能提升文件读写性能,
   但在某些场景下,过大的缓冲区可能会导致内存使用过高。
   在本例中,设置为131072字节(即128KiB)。
-->
<configuration>
    <property>
		<name>fs.defaultFS</name>
		<value>hdfs://node1:8020</value>
	</property>
	
	<property>
		<name>io.file.buffer.size</name>
		<value>131072</value>
	</property>
</configuration>

配置hdfs-site.xml:

vim etc/hadoop/hdfs-site.xml
<configuration>
  <property>
    <name>dfs.datanode.data.dir.perm</name>
    <value>700</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/data/nn</value>
  </property>
  <property>
    <name>dfs.namenode.hosts</name>
    <value>node1,node2,node3</val

http://www.niftyadmin.cn/n/5460492.html

相关文章

Unreal的Quixel Bridge下载速度过慢、下载失败

从Quixel Bridge下载MetaHuman模型&#xff0c;速度非常慢&#xff0c;而且经常下载失败&#xff0c;从头下载。 可以从Quixel Bridge的右上角我的图标->Support->Show Logs打开日志目录 downloaded-assets目录下为下载的资源 bridge-plugin.log文件记录了下载URL和下载…

JAVA面试大全之数据库篇

目录 1、原理和SQL 1.1、什么是事务?事务基本特性ACID? 1.2、数据库中并发一致性问题? 1.3、事务的隔离等级? 1.4、ACID靠什么保证的呢?

Composer常见错误以及常用解决办法指南

Composer是一个PHP的依赖管理工具&#xff0c;它允许你声明项目所依赖的库&#xff0c;并在一个命令中安装或更新它们。在使用Composer的过程中&#xff0c;可能会遇到一些常见的错误。以下是一些常见的Composer错误及其常用的解决办法&#xff1a; “Your requirements could …

消息队列经典应用场景

笔者心中,消息队列,缓存,分库分表是高并发解决方案三剑客。 在职业生涯中,笔者曾经使用过 ActiveMQ 、RabbitMQ 、Kafka 、RocketMQ 这些知名的消息队列 。 这篇文章,笔者结合自己的真实经历,和大家分享消息队列的七种经典应用场景。 1 异步&解耦 笔者曾经负责某电…

HarmonyOS像素转换-如何使用像素单位设置组件的尺寸。

1 卡片介绍 基于像素单位&#xff0c;展示了像素单位的基本知识与像素转换API的使用。 2 标题 像素转换&#xff08;ArkTS&#xff09; 3 介绍 本篇Codelab介绍像素单位的基本知识与像素单位转换API的使用。通过像素转换案例&#xff0c;向开发者讲解了如何使用像素单位设…

【系统架构师】-第18章-安全架构设计

(1)信息泄露&#xff1a;信息被泄露或透露给某个非授权的实体。 (2)破坏信息的完整性&#xff1a;数据被非授权地进行增删、修改或破坏而受到损失。 (3)拒绝服务&#xff1a;对信息或其他资源的合法访问被无条件地阻止。 (4)非法使用(非授权访问):某一资源被某个非授权的人或…

智慧公厕:城市生活必备的智能公共厕所服务

公共厕所是城市社会生活中不可或缺的基础设施&#xff0c;而智慧公厕则通过智能化的管理模式&#xff0c;为公众提供更好的公共厕所服务。通过监测公厕内部的人体活动状态、人体存在状态、空气质量情况、环境变化情况以及设施设备的运行状态等信息&#xff0c;智慧公厕实现了厕…

【python】常用函数汇总(持续更新……)

文章目录 【numpy.exp()】返回e的幂次方&#xff0c;e是一个常数为2.71828【np.dot()】矩阵相乘【np.linalg.inv()】矩阵求逆 【numpy.exp()】返回e的幂次方&#xff0c;e是一个常数为2.71828 举例&#xff1a;numpy.exp() 【np.dot()】矩阵相乘 【要点】 1、前者的列数后者…