HDFS的Shell操作及客户端配置方法

news/2024/5/20 4:29:23 标签: hdfs, npm, hadoop

HDFS进程启停命令

Hadoop HDFS组件内置了HDFS集群的一键启停脚本。

  • $HADOOP_HOME/sbin/start-dfs.sh,一键启动HDFS集群
  • $HADOOP_HOME/sbin/stop-dfs.sh,一键关闭HDFS集群
    执行原理:
  1. 在执行此脚本的机器上,启动(关闭)SecondaryNameNode
  2. 读取core-site.xml内容(fs.defaultFS项),确认NameNode所在机器,启动(关闭)NameNode
  3. 读取workers内容,确认DataNode所在机器,启动(关闭)全部DataNode

除了一键启停外,也可以单独控制进程的启停

  • $HADOOP_HOME/sbin/hadoop-daemon.sh,此脚本可以单独控制所在机器的进程的启停
    用法:hadoop-daemon.sh (start|status|stop) (namenode|secondarynamenode|datanode)
  • $HADOOP_HOME/bin/hdfs,此程序也可以用以单独控制所在机器的进程的启停
    用法:hdfs --daemon (start|status|stop) (namenode|secondarynamenode|datanode)

HDFS文件系统基本命令(跟Linux命令基本一样)

  • hadoop命令(老版本用法),用法:hadoop fs [generic options]
  • hdfs命令(新版本用法),用法:hdfs dfs [generic options]
  1. 创建文件夹 (mkdir)
    hadoop fs -mkdir [-p] <path>
    hdfs dfs -mkdir [-p] <path>
hadoop fs -mkdir -p /itest
hdfs dfs -mkdir -p /itest
  1. 上传文件到HDFS指定目录下(上传put,下载 get)
    hadoop fs -put [-f] [-p] <localsrc> ... <dst>
    hdfs dfs -put [-f] [-p] <localsrc> ... <dst>
hadoop fs -put test.txt /itest
hdfs dfs -put test.txt /itest
  1. 追加数据到HDFS文件中(appendToFile)
    hadoop fs -appendToFile <localsrc> ... <dst>
    hdfs dfs -appendToFile <localsrc> ... <dst>
hadoop fs -appendToFile 2.txt 3.txt /itest/1.txt
hdfs dfs -appendToFile 2.txt 3.txt /itest/1.txt
  1. HDFS数据删除操作(rm,skipTrash跳过回收站)
    hadoop fs -rm -r [-skipTrash] URI [URI ...]
    hdfs dfs -rm -r [-skipTrash] URI [URI ...]
hadoop fs -rm  -r -skipTrash /itest
hdfs dfs -rm  -r -skipTrash /itest
  1. HDFS shell其它命令(点此参照官方文档
    在这里插入图片描述
  2. HDFS WEB浏览
    在这里插入图片描述
    使用WEB浏览操作文件系统,一般会遇到权限问题
    在这里插入图片描述
    这是因为WEB浏览器中是以匿名用户(dr.who)登陆的,其只有只读权限,多数操作是做不了的。
    如果需要以特权用户在浏览器中进行操作,需要配置如下内容到core-site.xml并重启集群
  <property>
    <name>hadoop.http.staticuser.user</name>
    <value>hadoop</value>
  </property>

== 注意:不推荐这样做 ==
HDFS WEBUI,只读权限挺好的,简单浏览即可
如果给与高权限,会有很大的安全问题,造成数据泄露或丢失

Big Data Tools插件

1、插件安装

在Jetbrains的产品中,均可以安装插件,其中:Big Data Tools插件可以帮助我们方便的操作HDFS,以下均支持Bigdata Tool插件,如

  • IntelliJ IDEA(Java IDE)
  • PyCharm(Python IDE)
  • DataGrip(SQL IDE)
    如图,在设置->Plugins(插件)-> Marketplace(市场),搜索Big Data Tools,点击Install安装即可
    在这里插入图片描述
    在这里插入图片描述

2、配置Windows

需要对Windows系统做一些基础设置,配合插件使用

  • 解压Hadoop安装包到Windows系统,如解压到:E:\hadoop-3.3.4
  • 设置$HADOOP_HOME环境变量指向:E:\hadoop-3.3.4
  • 下载 hadoop.dll 点此官网下载 和 winutils.exe 点此官网下载
    hadoop.dll和winutils.exe放入$HADOOP_HOME/bin中
  • 然后打开插件,如下图
    在这里插入图片描述
    在这里插入图片描述
    至此,HDFS的Shell操作及客户端配置方法结束!!

http://www.niftyadmin.cn/n/5456450.html

相关文章

基于SSM的大学生兼职系统

基于SSM的大学生兼职平台的设计与实现 摘要 信息社会、信息时代造就了现在我们所拥有的科技生活。各种关于生活、社团的互联网软件逐步的走向了百姓的生活当中&#xff0c;移动互联网在当下的时代中有着非常成熟的应用&#xff0c;人们通过智能手机可以随时随地的通过网络的连…

P8611 [蓝桥杯 2014 省 AB] 蚂蚁感冒

一、问题描述 P8611 [蓝桥杯 2014 省 AB] 蚂蚁感冒 二、问题简析 这道题的关键是如何处理蚂蚁掉头的问题。我们可以把蚂蚁掉头看作直接穿了过去。 为什么可以这样做&#xff1f;如果两只蚂蚁中有一只感染&#xff0c;则碰头后两只都感染了&#xff0c;不需要区分哪一只。如…

自学算法:03 一维动态规划

有些递归在展开计算时&#xff0c;总是重复调用同一个子问题的解&#xff0c;这种重复调用的递归变成动态规划会很有收益&#xff0c;而如果每次展开都是不同的解&#xff0c;或者重复调用的现象很少&#xff0c;那么没有改动态规划的必要。 所以任何动态规划问题都一定对应着一…

git 更改仓库地址

背景&#xff1a; 项目本来在A仓库进行保管&#xff0c;研发已经开发一段时间了&#xff0c;现在切换到了新的仓库B&#xff0c;研发本地如何将仓库切换到B 解决&#xff1a; # 查看远端地址 git remote -v # 查看远端仓库名 git remote # 重新设置远程仓库 git remote s…

aws使用记录

数据传输&#xff08;S3) 安装命令行 安装awscli: https://docs.aws.amazon.com/zh_cn/cli/latest/userguide/getting-started-install.html#getting-started-install-instructions 直到 aws configure list 可以运行 身份验证&#xff1a; 运行&#xff1a; aws config…

【Linux】 centos7安装卸载SQL server(2017、2019)

一、安装配置 准备一个基础Linux配置&#xff1a; 内存为20GB 运行内存为2GB的系统&#xff08;数据库小于2GB安装不了&#xff09; 1、网络配置 我们需要进行网络的连接 进入 cd /ect/sysconfig/network-script/ 编辑文件ifcfg-ens33 vi ifcfg-ens33 Insert键进行编辑 把ONBOO…

html5+css3学习笔记

1. 超文本标记语言&#xff08;HTML&#xff09;简介 html是超文本&#xff08;可加入图片、声音、动画、多媒体、超越了文本限制&#xff1b;从1个文件跳转到另1个文件&#xff0c;与世界各地主机的文本连接&#xff09;标记语言&#xff0c;由一系列标记&#xff08;也称为标…

celltypist使用体验

文章目录 brief注意事项实例演示官方教程现实数据 总结 brief 类似于singleR&#xff0c;可以对单细胞数据进行细胞注释&#xff0c;该分类器使用逻辑回归模型&#xff0c;训练集使用了一些已发表和注释的单细胞数据&#xff0c;训练集较大然后标签可能注释的比较好&#xff0…