HDFS的Shell操作及客户端配置方法

news/2024/5/20 4:29:23 标签: hdfs, npm, hadoop

HDFS进程启停命令

$HADOOP_HOME/sbin/hadoop-daemon.sh，此脚本可以单独控制所在机器的进程的启停
用法：hadoop-daemon.sh (start|status|stop) (namenode|secondarynamenode|datanode)
$HADOOP_HOME/bin/hdfs，此程序也可以用以单独控制所在机器的进程的启停
用法：hdfs --daemon (start|status|stop) (namenode|secondarynamenode|datanode)

hadoop fs -mkdir -p /itest

hdfs dfs -mkdir -p /itest

上传文件到HDFS指定目录下（上传put，下载 get）
hadoop fs -put [-f] [-p] <localsrc> ... <dst>
hdfs dfs -put [-f] [-p] <localsrc> ... <dst>

hadoop fs -put test.txt /itest

hdfs dfs -put test.txt /itest

追加数据到HDFS文件中（appendToFile）
hadoop fs -appendToFile <localsrc> ... <dst>
hdfs dfs -appendToFile <localsrc> ... <dst>

hadoop fs -appendToFile 2.txt 3.txt /itest/1.txt

hdfs dfs -appendToFile 2.txt 3.txt /itest/1.txt

HDFS数据删除操作（rm，skipTrash跳过回收站）
hadoop fs -rm -r [-skipTrash] URI [URI ...]
hdfs dfs -rm -r [-skipTrash] URI [URI ...]

hadoop fs -rm  -r -skipTrash /itest

hdfs dfs -rm  -r -skipTrash /itest

  <property>
    <name>hadoop.http.staticuser.user</name>
    <value>hadoop</value>
  </property>

== 注意：不推荐这样做 ==
HDFS WEBUI，只读权限挺好的，简单浏览即可
如果给与高权限，会有很大的安全问题，造成数据泄露或丢失

在Jetbrains的产品中，均可以安装插件，其中：Big Data Tools插件可以帮助我们方便的操作HDFS，以下均支持Bigdata Tool插件，如

IntelliJ IDEA（Java IDE）
PyCharm（Python IDE）
DataGrip（SQL IDE）
如图，在设置->Plugins（插件）-> Marketplace（市场），搜索Big Data Tools，点击Install安装即可

需要对Windows系统做一些基础设置，配合插件使用

解压Hadoop安装包到Windows系统，如解压到：E:\hadoop-3.3.4
设置$HADOOP_HOME环境变量指向：E:\hadoop-3.3.4
下载 hadoop.dll 点此官网下载和 winutils.exe 点此官网下载
将hadoop.dll和winutils.exe放入$HADOOP_HOME/bin中
然后打开插件，如下图

至此，HDFS的Shell操作及客户端配置方法结束！！