hadoop集群基础配置

news/2024/5/20 3:40:02 标签: hadoop, hdfs, 大数据


hadoop1.0  mapreduce + HDFS
hadoop2.0  mapreduce + HDFS + YARN
加入YARN使得hadoop更加包容,其他的组件也可以在hadoop生态系统中运行
hadoop3.0  HDFS(分布式存储) + mapreduce(分布式计算框架) + YARN(集群资源调度)
3.0 1最低支持JAVA8 2加入了纠删码,可大幅压缩存储空间,提高存储效率

hadoop环境安装
下载包选tar.gz    关闭防火墙 设置主机名 hostname=bigdata01 或 vim /etc/hostname
名称与IP建立联系 vim /etc/host  :  192.168.70.128  bigdata01
JVM ENV:  下载解压安装包tar.gz  tar -zxvf jdk_8u...    
配置环境变量:vim /etc/profile:  export JAVA_HOME = /data/soft/jdk1.8
export PATH =.: $JAVA_HOME/bin:$PATH
Source /etc/profile
Java -version

Install hadoop
Tar -zxvf hadoop-3.2.2.tar.gz
配置环境变量:vim /etc/profile : export HADOOP_HOME=/data/soft/hadoop-3.2.2
Export $PATH=.:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

Bin/ 操作hdfs和yarn组件的脚本
Sbin/ 启动和停止组件。。。


/etc/hadoop/:
Hadoop-env.sh 环境变量java hadoop
编辑配置文件 hadoop-3.2.2/etc/hadoop/hadoop-env.sh:
Export JAVA_HOME=/data/soft/jdk1.8
Export HADOOP_LOG_DIR=/data/hadoop_report/logs/hadoop

core-site.xml 配置主机名和端口,临时目录
Hdfs-site.sh 设置集群的节点个数(包括主节点)
Mapred-site.xml 配置使用的资源调度框架
Yarn-site.xml 配置yarn上可支持使用的服务和白名单
Workers  将从节点的hostname写进去

使用前需格式化系统:
bin/hdfs  namenode -format

启动集群: sbin/start-dfs.sh
启动前需先配置一些信息在脚本中:
 vim Sbin/start-dfs.sh :  
Vim sbin/stop-dfs.sh:
Vim sbin/start-yarn.sh:
Vim sbin/stop-yarn.sh:
 
Jps
Namenode
Datanode
Resourcemanager
Secondarynamenode
Nodemanager

主节点:
namenode
resource manager
secondary namenode
jvm
linux os
server

从节点:
datanode
node manager
jvm
linux os
server

配置从节点时,
1远程免密登陆:
Ssh-keygen -t rsa
Cat  ~/.ssh/id_rsa.pub  >> ~/.ssh/authorized_keys

Ssh bigdata01

防火墙:systemctl stop/disable iptables

Ip:
Vim /etc/hosts
Vim /etc/hostname

Vim /etc/sysconfig/network-scripts/ifcfg-eth0

使用克隆建立从节点后需要修改 /etc/udev/rules.d/70-persisent-net.rules
复制其中的MAC地址 到 /etc/sysconfig/network-scripts/ifcfg-eth0

Service network restart


Scp -rq hadoop3.2.2  bigdata02:/data/soft
-r 递归到每个子文件夹  -q 安静模式,不显示中间信息


http://www.niftyadmin.cn/n/246603.html

相关文章

Unity 数据管理(整个游戏的数据怎么管理,数据系统怎么设计)

游戏数据管理通常包括以下几个方面: 数据库设计:包括数据库表结构设计、数据类型设计、数据索引设计、存储过程设计等。数据缓存:为了提高游戏的性能,通常需要将游戏数据进行缓存,比如将常用的数据放在内存中&#xff…

thingsboard ARM网关

G5501边缘计算网关 G5501是采用中高端的通用型 SOC,一款4 核 arm 架构 A55 处理器的 网关设备。标配处理器为 Cortex-A55 四核,最高主频 2GHz 的处理器, 内置 4GB DDR4 内存,32GB eMMC 存储。 集成Mali G52 2EE 图形处理器GPU&am…

符号别名,编译指定版本,链接指定版本

说明 version script也是ld command的一种; 使用场景: 共享库 符号版本只有共享库场景使用; 因为共享库才会被动态链接依赖; 兼容 A编译时依赖B的旧版本符号; 但是到了执行的时候, 找到的是B的新版本库; 新版本也有对应版本的函数; 但是根据A记录的符号名和版本号; A会从B…

数据处理方法(LFSR)

一、线性反馈移位寄存器(LFSR)编码概述 线性反馈移位寄存器(LFSR):通常由移位寄存器和异或门逻辑组成。其主要应用在: 伪随机数,伪噪声序列,计数器,BIST,数据…

PP-KANBAN-看板概述

PP-KANBAN-看板概述 看板概述-OverviewPUSH-PULL 原则看板的补充策略看板的系统配置 看板概述-Overview 看板是1953年由Mr. Taiichi Ohno在丰田汽车公司发明的。当时,整个汽车行业正在通过实施丰田的“丰田生产系统”来提升管理。这个系统基于基于物料的卡片实现物…

【Python】【进阶篇】二十五、Python爬虫的Selenium的实战应用

目录 二十五、Python爬虫的Selenium的实战应用25.1 实现自动搜索25.2 滚动滑动条25.3 实现翻页抓取25.4 完整程序代码 二十五、Python爬虫的Selenium的实战应用 实战案例目标:抓取京东商城(https://www.jd.com/)商品名称、商品价格、评论数量…

照片尺寸怎么修改,3大工具推荐

照片尺寸怎么修改?对于许多人来说,调整图片的尺寸可能是一个日常任务,无论是个人或者工作上都可能会遇到这个需求。适当地调整图片的尺寸可以让图片更具专业性和美观性,而且能够减小文件大小,提高图片的加载速度。在电…

史上最严宝宝口粮新国标出台,DHA和维生素D可能无需额外补充了

自2023年2月22日起,我国婴幼儿配方食品(以下简称配方奶)新国标开始实施。这意味着2023年2月22日以后在中国上架销售的配方奶必须符合新国标,重新取得国家市场监督管理总局食品评审中心(CFE-SAMR)的注册。这…