20230611_Hadoop_BigDataTools

news/2024/5/20 4:29:27 标签: hadoop, hdfs, 大数据

Hadoop客户端

一、Big Data Tools工具

  1. Pycharm专业版下载Big Data Tools工具。

  2. 获取hadoop.dll与winutils.exe文件放置于$HADOOP_HOME/Bin中。

  3. 配置系统环境变量:E:\hadoop-3.3.4

  4. 配置Big Data Tools,登录。

    -- 如果需要走第二种路径配置登录, 需要修改etc/hadoop中的core-site.xml等文件。
    

二、HDFS NFS Gateway

HDFS提供了基于NFS(Network File System)的插件,可以对外提供NFS网关,供其他系统挂载使用。

NFS网关支持NFSv3,并允许讲HDFS作为客户机本地文件系统的一部分挂载,现在支持:

  • 上传,下载,删除,追加内容

    ''' 挂载使用,类似于在我的电脑生成的放置于云端的百度网盘。'''
    
配置NFS

配置HDFS需要配置如下内容:

  • core-site.xml,新增配置项,以及hdfs-site.xml,新增配置项。
  • 开启portmap,nfs3两个进程。

在node1进行如下操作

  1. 在core-site.xml内新增如下两项
<property>
	<name>hadoop.proxyuser.hadoop.groups</name>
	<value>*</value>
</property>
"""
允许hadoop用户代理任何其他用户组
"""
<property>
	<name>hadoop.proxyuser.hadoop.hosts</name>
	<value>*</value>
</property>
"""
允许代理任意服务器的请求
"""
  1. hdfs-site.xml中新增如下项

    <property>
    	<name>nfs.superuser</name>
    	<value>hadoop</value>
    </property>
    """
    NFS操作HDFS系统,所使用的超级用户(HDFS的启动用户为超级用户)。
    """
    <property>
    	<name>nfs.dump.dir</name>
    	<value>/tmp/.hdfs-nfs</value>
    </property>
    """
    NFS接收数据上传时使用的临时目录。
    """
    <property>
    	<name>nfs.exports.allowed.hosts</name>
    	<value>192.168.88.1 rw</value>
    </property>
    """
    NFS允许连接的客户端IP和权限,rw表示读写,IP整体或者部分可以以*代替。
    课程设置的允许192.168.88.1以rw连接
    (这个IP是电脑虚拟网卡VMnet8的IP,连接虚拟机就是走的这个网卡)
    """
    
    
  2. 将配置好的文件分发到node2和node3上

     scp core-site.xml hdfs-site.xml node2:`pwd`/
     scp core-site.xml hdfs-site.xml node3:`pwd`/
    
  3. 重启Hadoop的HDFS集群

  4. 停止系统的NFS相关进程(必须root用户权限执行)

    • systemctl stop nfs; systemctl disable nfs 关闭系统nfs
    • yum remove -y rpcbind 卸载系统自带rpcbind
  5. 启动portmap(HDFS自带的rpcbind功能)(必须root用户权限执行)

    hdfs --daemon start portmap
    
  6. 启动nfs(HDFS自带的NFS功能)(必须以Hadoop用户执行)

    hdfs --daemon start nfs3
    
  7. 验证是否成功:

    在node2和node3执行:rpcinfo -p node1

    出现mountd和nfs后

    再输入:showmount -e node1

    可以看到 /192.168.88.1即为成功

  8. 在cmd中输入:

    # 注意空格
    net use X: \\192.168.88.101\!
    

http://www.niftyadmin.cn/n/427776.html

相关文章

springboot的数据访问和数据视图

当使用 Spring Boot 进行数据访问时&#xff0c;我们可以选择使用 MyBatis 或 JPA&#xff08;Java Persistence API&#xff09;来实现增删改查操作。下面我将分别给出使用这两种方式整合数据访问的详细步骤和示例&#xff0c;同时结合 Thymeleaf 实现数据展现。 方式一: 使用…

Qt学习06:QPainter绘画

文章首发于我的个人博客&#xff1a;欢迎大佬们来逛逛 Qt学习06&#xff1a;QPainter绘画 Qt绘图 Paint System Qt的绘制系统支持在屏幕和打印设备上使用相同的API进行绘制&#xff0c;主要基于QPainter、QPaintDevice和QPaintEngine类。 QPainter用于执行绘图操作&#xff…

Golang每日一练(leetDay0095) 第一个错误的版本、完全平方数

目录 278. 第一个错误的版本 First Bad Version &#x1f31f; 279. 完全平方数 Perfect Squares &#x1f31f;&#x1f31f; &#x1f31f; 每日一练刷题专栏 &#x1f31f; Rust每日一练 专栏 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日…

MySQL-索引详解(四)

♥️作者&#xff1a;小刘在C站 ♥️个人主页&#xff1a;小刘主页 ♥️每天分享云计算网络运维课堂笔记&#xff0c;努力不一定有回报&#xff0c;但一定会有收获加油&#xff01;一起努力&#xff0c;共赴美好人生&#xff01; ♥️树高千尺&#xff0c;落叶归根人生不易&…

基于BES DSP DRC(动态幅度控制)算法C语言程序实现

+ hezkz17 进数字音频系统研究开发交流答疑 写了一个DSP DRC(动态幅度控制)算法 C语言程序  要实现DSP DRC算法的C语言程序,需要以下步骤: 1了解DRC算法的原理和数学模型,例如压缩器和扩展器的工作原理、峰值检测和平均功率检测等等。 2根据模型设计算法,考虑使用基本…

Argo CD 实践教程 02

1.5 构建一个简单的GitOps操作符 现在我们已经了解了控制循环是如何工作的&#xff0c;已经试验了声明性命令&#xff0c;并且知道了如何使用基本的Git命令&#xff0c;我们已经有了足够的信息来构建基本的GitOps操作符。我们现在需要创建如下三个东西: 我们将首先克隆一个Git…

chatgpt赋能python:Python中如何截断字符串

Python中如何截断字符串 Python是一种简单易学、高效的编程语言&#xff0c;旨在让开发人员更快、更方便地完成任务。然而&#xff0c;在实际开发过程中&#xff0c;我们常常需要对字符串进行截断操作。那么&#xff0c;Python中怎么截断字符串呢&#xff1f;接下来就让我们来…

gitlab+jenkins+harbor实现CI/CD(1)——环境准备

gitlabjenkinsharbor实现CI/CD&#xff08;1&#xff09;——环境准备 前言一、git工具git安装初始化版本库登录上传 二、gitlab使用gitlab部署登录设置克隆项目 jenkins使用安装jenkins登录设置 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 例如&am…