docker搭建hadoop集群个人总结

news/2024/5/20 1:29:56 标签: hadoop, docker, hdfs

1.搭建过程

https://dblab.xmu.edu.cn/blog/1233/
https://www.cnblogs.com/rmxd/p/12051866.html#_label4
按照这两篇文章即可，总结来说 pull ubuntu，进入系统，配置java、hadoop，保存镜像。然后根据这个镜像启动三个容器master，slave1，slave2，在master上配置相关信息。

2.注意的踩坑点（与两篇文章有出入）：

mapred-site.xml 如下配置

 <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
 </property>
<property>
  <name>yarn.app.mapreduce.am.env</name>
  <value>HADOOP_MAPRED_HOME=/usr/local/hadoop</value>
</property>
<property>
  <name>mapreduce.map.env</name>
  <value>HADOOP_MAPRED_HOME=/usr/local/hadoop</value>
</property>
<property>
  <name>mapreduce.reduce.env</name>
  <value>HADOOP_MAPRED_HOME=/usr/local/hadoop</value>
</property>
</configuration>

start-dfs.sh stop-dfs.sh 首部加入如下属性

HDFS_DATANODE_USER=root
HDFS_DATANODE_SECURE_USER=hdfs  #hadoop3.0后使用该名称
HDFS_NAMENODE_USER=root
HDFS_SECONDARYNAMENODE_USER=root

start-yarn.sh stop-yarn.sh首部加入如下属性

YARN_RESOURCEMANAGER_USER=root
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=root

容器重启后，配置的hosts文件中的修改会丢失

原因见链接: https://blog.csdn.net/Lekaor/article/details/127442047，需要重新配置一遍或者在网上找方法去固定ip。

运行程序

把程序在本地打成jar包，传到容器内（ubuntu）（docker cp 命令）。把数据上传到容器内，再上传到 hdfs 上。
hadoop jar 执行程序

如何在浏览器访问

使用 docker 进行端口映射 8808 和 50070，即可在启动集群后在本地浏览器访问

docker搭建hadoop集群个人总结

1.搭建过程

2.注意的踩坑点（与两篇文章有出入）：

mapred-site.xml 如下配置

start-dfs.sh stop-dfs.sh 首部加入如下属性

start-yarn.sh stop-yarn.sh首部加入如下属性

容器重启后，配置的hosts文件中的修改会丢失

运行程序

如何在浏览器访问

相关文章

一起Talk Android吧（第四百二十回：贝塞尔曲线）

[MQ] 死信队列介绍与场景描述

【攻破css系列——第九天】常规流

C++模拟OpenGL库——图片处理及纹理系统（三)：图片缩放操作：简单插值二次线性插值

关于Conversational QA 的一些调研

第十三届蓝桥杯c++b组-积木画

【mysql】mysql 数据备份与恢复使用详解

L848字母位移

docker搭建hadoop集群 个人总结

1.搭建过程

2.注意的踩坑点（与两篇文章有出入）：

mapred-site.xml 如下配置

start-dfs.sh stop-dfs.sh 首部加入如下属性

start-yarn.sh stop-yarn.sh首部加入如下属性

容器重启后，配置的hosts文件中的修改会丢失

运行程序

如何在浏览器访问

相关文章

docker搭建hadoop集群个人总结