【Hadoop】Hadoop概念与实践下载安装MAC(M1芯片)

news/2024/5/20 1:56:24 标签: hadoop, 大数据, hdfs

前置工作

安装 HomeBrew

参考官方文档进行安装

配置本机 ssh 免密登录

hadoop 运行过程中需要 ssh localhost,需要做一些配置保证可以执行成功

允许远程登录
偏好设置 -> 共享 -> 勾选「远程登录」

配置 SSH

  1. 通过 ssh-keygen 生成 ssh key
  2. ssh-copy-id -i [key 文件] localhost 配置免密登录
  3. ssh localhost 也只能正配置是否成功

安装 Hadoop

brew install hadoop

hadoop 安装成功

配置

配置环境变量

  1. brew info hadoop 查看 hadoop 安装目录

  2. 定义 HADOOP_HOME 变量并添加到 PATH 中

    # Hadoop
    export HADOOP_HOME=/usr/local/Cellar/hadoop/3.3.4/libexec
    export PATH=$PATH:HADOOP_HOME
    
  3. source ~/.zshrc 使变量生效

配置 core-site
$HADOOOP_HOME/etc/hadoop/core-site.xml文件中配置临时文件目录及 hdfs 文件访问地址

<configuration>
  <property>
      <name>hadoop.tmp.dir</name>
      <value>/usr/local/Cellar/hadoop/hdfs/tmp</value>
  </property>
  <property>
      <name>fs.default.name</name>
      <value>hdfs://localhost:9000</value>
  </property>
</configuration>

配置 mapped-site
$HADOOOP_HOME/etc/hadoop/mapped-site.xml 中配置

<configuration>
     <property>
         <name>mapred.job.tracker</name>
         <value>localhost:9010</value>
     </property>
</configuration>

配置 hdfs-site
$HADOOOP_HOME/etc/hadoop/hdfs-site.xml 中配置副本数

<configuration>
     <property>
         <name>dfs.replication</name>
         <value>1</value>
     </property>
</configuration>

配置 hadoop-env
$HADOOOP_HOME/etc/hadoop/hadoop-env.sh 中配置 JAVA_HOME

export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_331.jdk/Contents/Home

初始化 HDFS NameNode

hdfs namenode -format

namenode 初始化

测试与验证

启动 hdfs

cd $HADOOP_HOME
../sbin/start-dfs.sh 

浏览器输入 http://localhost:9870,出现下面界面则代表启动成功

hdfs 管理界面

查看 hdfs report

hdfs dfsadmin -report

hdfs 报告

启动 yarn

cd $HADOOP_HOME
../sbin/start-yarn.sh 

浏览器输入 http://localhost:8088,出现下面界面则代表启动成功

yarn 管理界面

遇到问题及解决

  • 初始化 namenode 时提示 ERROR: JAVA_HOME @@HOMEBREW_JAVA@@ does not exist.
    $HADOOOP_HOME/etc/hadoop/hadoop-env.sh 中配置 JAVA_HOME,和系统保持一致即可

  • 提示 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

    1. 从 GitHub 下载相应的 native 库
    2. 将 lib/native 复制到 $HADOOP_HOME 目录内
    3. ~/.zshrc 添加下面配置并使用 source 令其生效
    export HADOOP_OPTS="$HADOOP_OPTS -Djava.library.path=$HADOOP_HOME/lib/native"
    

参考资料

mac 安装 Hadoop - 简书

hadoop】在Mac m1下搭建安装hadoop环境(亲测有效版)_mac部署hadoop_小松不菜的博客-CSDN博客

Hadoop – Apache Hadoop 3.3.5

https://monday.blog.csdn.net/article/details/88189753

hadoop3.2.3 编译 native库(超详细,亲测成功)_hadoop native_兔帮大人的博客-CSDN博客

Index of /apache/hadoop/common/stable

Mac M1芯片本地安装 hadoop 集群填坑之路_喵王叭的博客-CSDN博客

mac安装Hadoop3.2.1教程(超详细)_http://localhost:9870/dfshealth.html_liemozhu的博客-CSDN博客

GitHub - healchow/hadoop-native-macos: The Hadoop native libraries for macOS

Mac下SSH免密登录localhost,error:Permission denied (publickey,password,keyboard-interactive). - 爱码网


http://www.niftyadmin.cn/n/363374.html

相关文章

大公司最喜欢问的Java集合类面试题

大公司最喜欢问的Java集合类面试题 接口:Collection用Iterator模式实现遍历集合List接口LinkedList类ArrayList类Vector类Stack 类Set接口Map接口Hashtable类HashMap类WeakHashMap类总结看了一些所谓大公司的JAVA面试问题,发现对于JAVA集合类的使用都比较看重似的,而自己在这…

成员属性辨析:Python 中的实例属性与静态属性

文章目录 参考描述成员属性实例属性&#xff08;Instance Attributes&#xff09;静态属性&#xff08;Static Attributes&#xff09; 实例属性与局部变量形参 self不只是 self实例属性与局部变量 参考 项目描述Python 官方文档https://docs.python.org/zh-cn/3/搜索引擎Goog…

基于Faster rcnn pytorch的遥感图像检测

基于Faster rcnn pytorch的遥感图像检测 代码&#xff1a;https://github.com/jwyang/faster-rcnn.pytorch/tree/pytorch-1.0 数据集 使用RSOD遥感数据集&#xff0c;VOC的数据格式如下&#xff1a; RSOD是一个开放的目标检测数据集&#xff0c;用于遥感图像中的目标检测。…

Python自动化测试框架有哪些?怎么选

目录 自动化测试框架概念 自动化测试框架根据思想理念和深度不同&#xff0c;渐进式的分为以下几种&#xff1a; 模块化测试脚本框架&#xff1a; 测试库框架&#xff1a; 数据驱动测试框架&#xff1a; 关键字驱动或表驱动的测试框架&#xff1a; 混合测试自动化框架&am…

Java内存模型(Java Memory Mode,JMM)

并发编程模型的两个关键问题 线程之间如何通信及线程之间如何同步。 线程之间如何通信&#xff1a;共享内存&#xff0c;消息传递线程之间如何同步通信是指线程之间以何种机制来 交换信息同步是指程序中用于控制不同线程间 操作发生相对顺序 的机制在共享内存的并发模型里&a…

微信小程序为什么不用HTML5、CSS,自己搞了个WXML、WXSS,很多框架用不了,好处一点不知道?

你在小程序中需要使用HTML5、 CSS来创建页面&#xff0c;那么你一定会碰到一些问题&#xff0c;比如&#xff1a; 1.小程序中的布局没有 JS支持&#xff0c;没有 JS渲染逻辑。 2.没有内置 css&#xff0c;都是靠 JS自己实现的。 3.很多框架不能使用&#xff0c;比如&#xf…

顶满,阿里P8架构师独家分享的微服务实战笔记

微服务简介 简而言之&#xff0c;微服务架构风格是一种将单个应用程序开发为“一套小型服务”的方法&#xff0c;每个服务“运行在自己的进程中”&#xff0c;并通过轻量级机制(通常是HTTP资源API)进行通信。这些服务“围绕业务功能构建”&#xff0c;并通过全自动部署机制“独…

操作系统层面下——进程状态讲解

目录 一.进程的状态&#xff1a;运行态 1.什么是运行状态&#xff1f; 2.进程进入内存的详细图解&#xff1a; 总结&#xff1a; 二.进程的状态&#xff1a;阻塞态 1.什么是阻塞状态&#xff1f; 三.进程的状态&#xff1a;挂起态 1.什么是挂起态&#xff1f; 2.阻塞与挂起的…