HDFS HA配置

news/2024/5/20 5:31:05 标签: hadoop, 大数据, hdfs, zookeeper

文章目录

  • Hadoop的HDFS HA搭建
    • 重新解压安装Hadoop-2.7.2到/opt/ha上
    • 进入/opt/ha/hadoop-2.7.2/etc/hadoop配置
    • 重新配置/etc/profile的Hadoop位置,并重启
    • 测试
    • 测试没有问题,就开始启动

Hadoop的HDFS HA搭建

重新解压安装Hadoop-2.7.2到/opt/ha上

hadoop272etchadoop_5">进入/opt/ha/hadoop-2.7.2/etc/hadoop配置

hadoopenvsh_7">hadoop-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144

core-site.xml

<configuration>
<!-- 指定HDFS中NameNode的地址 -->
<property>
	<name>fs.defaultFS</name>
	<value>hdfs://mycluster</value>
</property>
<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
	<name>hadoop.tmp.dir</name>
	<value>/opt/ha/hadoop-2.7.2/data/tmp</value>
</property>
<property>
	<name>ha.zookeeper.quorum</name>
	<value>server1:2181,server2:2181,server3:2181</value>
</property>
</configuration>

hdfssitexml_34">hdfs-site.xml

<configuration>
<!-- 关闭权限检查-->
<property>
  <name>dfs.permissions.enable</name>
  <value>false</value>
</property>
<!-- 副本数 -->
<property>
  <name>dfs.replication</name>
  <value>3</value>
</property>
<!-- 指定Hadoop辅助名称节点主机配置 -->
<property>
  <name>dfs.namenode.secondary.http-address</name>
  <value>server3:50090</value>
</property>
<!-- 完全分布式集群名称-->
<property>
  <name>dfs.nameservices</name>
  <value>mycluster</value>
</property>
<!-- nameservice ID-->
<property>
  <name>dfs.ha.namenodes.mycluster</name>
  <value>nn1,nn2</value>
</property>
<!-- namenode address in fs.defaultFS of core-site-->
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn1</name>
  <value>server1:9000</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn2</name>
  <value>server2:9000</value>
</property>
<!--namenode HTTP address-->
<property>
  <name>dfs.namenode.http-address.mycluster.nn1</name>
  <value>server1:50070</value>
</property>
<property>
  <name>dfs.namenode.http-address.mycluster.nn2</name>
  <value>server2:50070</value>
</property>
<!--the URI which identifies the group of JNs where the NameNodes will write/read edits-->
<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://server1:8485;server2:8485;server3:8485/mycluster</value>
</property>
<!--the Java class that HDFS clients use to contact the Active NameNode-->
<property>
  <name>dfs.client.failover.proxy.provider.mycluster</name>
  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!--a list of scripts or Java classes which will be used to fence the Active NameNode during a failover-->
<property>
  <name>dfs.ha.fencing.methods</name>
  <value>sshfence</value>
</property>
<!--SSH to the Active NameNode and kill the process-->
<property>
  <name>dfs.ha.fencing.ssh.private-key-files</name>
  <value>/home/server/.ssh/id_rsa</value>
</property>
<property>
      <name>dfs.ha.fencing.methods</name>
      <value>sshfence</value>
</property>
<property>
  <name>dfs.ha.fencing.ssh.connect-timeout</name>
  <value>30000</value>
</property>
<property>
  <name>dfs.journalnode.edits.dir</name>
  <value>/opt/ha/hadoop-2.7.2/data/jn</value>
</property>
<property>
  <name>dfs.ha.automatic-failover.enabled</name>
  <value>true</value>
</property>
</configuration>

重新配置/etc/profile的Hadoop位置,并重启

这里需要注意,不重启仅仅只是source /etc/profile是不会生效的,你会发现NameNode在格式化的时候,还是格式化你原来的Hadoop

测试

  1. 三台虚拟机都输入以下指令
sbin/hadoop-daemon.sh start journalnode
  1. 第一个namenode的节点输入
bin/hdfs namenode -format
sbin/hadoop-daemon.sh start namenode
  1. 第二个namenode的节点输入
bin/hdfs namenode -bootstrapStandby
sbin/hadoop-daemon.sh start namenode
  1. 浏览器输入以下url,查看50070端口

    name1的ip:50070

    name2的ip:50070

  2. 在第一个namenode节点上启动datanode

sbin/hadoop-daemons.sh start datanode
  1. 将namenode转换为active
bin/hdfs haadmin -transitionToActive nn1
  1. 查看状态
bin/hdfs haadmin -getServiceState nn1

测试没有问题,就开始启动

  1. 关闭所有HDFS服务,namenode关不掉就kill -9 进程号杀死
sbin/stop-dfs.sh
  1. 启动zookeeper
bin/zkServer.sh start
  1. 初始化HA在zookeeper中的状态
bin/hdfs zkfc -formatZK
  1. 启动HDFS服务
sbin/start-dfs.sh

http://www.niftyadmin.cn/n/1476345.html

相关文章

19-python-迭代器、生成器

一、递归于迭代 迭代&#xff1a;下一组数据的由上一组数据next方法提供&#xff0c;只能往后走&#xff0c;不能往前走。 在列表中&#xff0c;由方法al.__iter__()把使列表遵循迭代器协议&#xff0c;转换成可迭代对象 可以用a.next()方法取列表数据 二、用for循环&#xff…

浅谈Qt事件的路由机制:鼠标事件

请注意&#xff0c;本文是探讨文章而不是教程&#xff0c;是根据实验和分析得出的结果&#xff0c;可能是错的&#xff0c;因此欢迎别人来探讨和纠正。 这几天对于Qt的事件较为好奇&#xff0c;平时并不怎么常用&#xff0c;一般都是用信号&#xff0c;对于事件的处理&#xff…

YARN HA配置

文章目录YARN HA配置先把HDFS HA配置了官方配置文档位置&#xff08;英语好去看看&#xff09;配置yarn-site.xml运行YARNYARN HA配置 先把HDFS HA配置了 HDFS HA教程地址 官方配置文档位置&#xff08;英语好去看看&#xff09; https://hadoop.apache.org/docs/r2.7.2/had…

中天微致力丰富生态建设,加速客户芯片产品开发

软件生态的建设对芯片上下游有着重要和积极的作用。 随着IC产品设计迭代周期愈发变短&#xff0c;生态环境对开发者来说至关重要&#xff0c;推动软件生态的建设对芯片上下游有着重要和积极的作用。为了满足客户的开发需求&#xff0c;缩短开发周期和降低研发投入&#xff0c;…

Redis命令——适合全体类型的常用命令

EXISTS key返回key是否存在。返回值&#xff1a;整数&#xff0c;1 表示存在&#xff0c; 0 表示不存在。exists key20exists key11DEl时间复杂度O(n)&#xff0c;n表示要移除的key的数量。移除单个字符串key的时间复杂度为O(1)。移除单个列表、集合、有序集合或哈希表的时间复…

第3章 Properties集合

1.1 Properties介绍Properties 类表示了一个持久的属性集。Properties 可保存在流中或从流中加载。属性列表中每个键及其对应值都是一个字符串。特点&#xff1a;1、Hashtable的子类&#xff0c;map集合中的方法都可以用。2、该集合没有泛型。键值都是字符串。3、它是一个可以持…

GridView的stretchMode属性

stretchMode属性值的作用是设置GridView中的条目以什么缩放模式去填充剩余空间。参数stretchMode 可选值为:none,spacingWidth,columnWidth, spacingWidthUniform 注意:spaceWidth和spacingWidthUniform是有差别的&#xff0c;下面通过一个例子说明一下,本人手机屏幕4.7英寸,分…

面试前总结(二)

知识点梳理 一、 JAVA&#xff08;SE&#xff09;基础&#xff1a; 概念-- 面向对象&#xff0c;继承&#xff0c;多态&#xff0c;接口&#xff0c;基础类型String、StringBuffer、StringBuilder-- 区别&#xff0c;源代码&#xff0c;常用方法、使用容器-- 类图结构&#x…