【HDFS】分布式文件系统的常用HDFS操作

news/2024/5/20 4:51:57 标签: hadoop, linux, hdfs, shell, 分布式

先理解

在这里插入图片描述
 

 

 

Shell命令行


●.启动Hadoop

shell">cd /usr/local/hadoop	
./sbin/start-dfs.sh

在这里插入图片描述


⑴.将本地的house.txt文件上传到HDFS的mydir目录下

shell">./bin/hdfs dfs -put ./house.txt mydir

⑵.将HDFS的dir目录下的house.txt下载 到本地

shell">./bin/hdfs dfs -get mydir/house.txt file:///usr/local/hadoop

⑶.将HDFS中指定文件(loli.txt)内容输入到终端

shell">./bin/hdfs dfs -cat loli.txt

⑷.输出HDFS中指定文件(loli.txt)的读写权限、大小、创建时间、路径等信息

shell">./bin/hdfs dfs -ls -h loli.txt

⑸.创建目录(dir1/dir2)

shell">./bin/hdfs dfs -mkdir -p dir1/dir2

⑹.在上面的目录下创建文件(dir1/dir2/myfile)

shell">./bin/hdfs dfs -touchz dir1/dir2/myfile

⑺.输出HDFS中指定目录(dir1/dir2)下的所有文件的读写权限、大小、创建时间、路径等信息

shell">./bin/hdfs dfs -ls -R -h dir1/dir2

⑻.删除HDFS中的文件(dir1/dir2/myfile)

shell">./bin/hdfs dfs -rm dir1/dir2/myfile

⑼.删除HDFS中的目录(dir1/dir2)

shell">./bin/hdfs dfs -rm dir1/dir2

⑽.强制删除HDFS中的目录(dir1/dir2)

shell">./bin/hdfs dfs -rm -R dir1/dir2

⑾.HDFS中移动文件(loli1.txt -> loli2.txt)

shell">./bin/hdfs dfs -mv loli1.txt loli2.txt

 
 
 

还是Shell命令行


❶.将本地的house.txt文件上传到HDFS
(HDFS中叫做loli.txt;若HDFS中已存在则追加,不存在则正常上传)

shell">if $(./bin/hdfs dfs -test -e loli.txt); 
then $(./bin/hdfs dfs -appendToFile house.txt loli.txt); 
else $(./bin/hdfs dfs -copyFromLocal -f house.txt loli.txt); 
fi

❷.从HDFS中下载loli.txt到本地
(本地中叫做house.txt;若本地中已存在house.txt,则下载时注意重命名为house2.txt)

shell">if $(./bin/hdfs dfs -test -e file:///usr/local/hadoop/house.txt); 
then $(./bin/hdfs dfs -copyToLocal loli.txt ./house2.txt); 
else $(./bin/hdfs dfs -copyToLocal loli.txt ./house.txt); 
fi

❸.给定一个HDFS文件的路径(dir1/dir2)。若路径存在则创建文件(filename),若路径不存在则创建路径后再创建文件(filename)

shell">if $(./bin/hdfs dfs -test -d dir1/dir2); 
then $(./bin/hdfs dfs -touchz dir1/dir2/filename); 
else $(./bin/hdfs dfs -mkdir -p dir1/dir2 && ./bin/hdfs dfs -touchz dir1/dir2/filename); 
fi

 
 
 

总结

如果比较熟悉Linux命令,这就非常简单。


http://www.niftyadmin.cn/n/1330278.html

相关文章

【文本分类】基于三种分类器实现影评的情感分析(朴素贝叶斯,最大熵,决策树)

朴素贝叶斯(Nave Bayes) 属性独立性是Nave Bayes的前提也是关键思想:通俗地说,就是根据已有的数据集,得到先验概率和各种属性对于各种决策的条件概率(可以理解为每种属性对每种决策的影响的大小&#xff0…

CF Round #537 (Div. 2)

ACM题集&#xff1a;https://blog.csdn.net/weixin_39778570/article/details/83187443 题目链接:https://codeforces.com/contest/1111 A 元音之间可以互相转换&#xff0c;辅音之间可以互相转换&#xff0c; 若两个句子无法转换成同个句子输出No 否则输出Yes #include<b…

【文本分类】基于两种分类器实现影评的情感分析(SVM,KNN)

支持向量机&#xff08;Support Vector Machine&#xff0c; SVM&#xff09; 当线性不可分时&#xff0c;就进行升维&#xff1b;接着就可以使用线性分类器了理论上来说&#xff0c;对任何分类问题&#xff0c;SVM都可以通过选择合适的核函数来完成核函数的选择直接影响到 SV…

【文本聚类】一篇文章弄懂三种聚类算法(K-Means,Agglomerative,DBSCAN)

概述 ▶ 常用的聚类方法 核心思想常见算法划分聚类将给定的数据集&#xff0c;采用分裂法划分为K个类K-Means, CLARANS层级聚类根据数据点之间的相似度创建一颗有层次的树Agglomerative(聚合), Divisive(分裂)密度聚类当一片区域内的数据点的密度大于某个阀值&#xff0c;则认…

MongoDB 崩溃,解决方案

1。这几天mongodb经常重启&#xff0c;今天直接崩溃&#xff0c;再也起不来了。 错误信息&#xff1a; ./mongod &2018-08-16T10:03:06.9750 …

CF Round #535 (Div. 3)

ACM题集&#xff1a;https://blog.csdn.net/weixin_39778570/article/details/83187443 题目链接:https://codeforces.com/contest/1108 A 给出俩个区间[L1,R1] [L2,R2] 输出x属于第一个区间&#xff0c;y属于第二个区间&#xff0c;并且x不等于y 保证有解 ---------------…

【文本聚类】三种聚类算法实现影评的情感分析(K-Means,Agglomerative,DBSCAN)

文本处理 from nltk.corpus import movie_reviews# ([...], pos) # ([...], neg) documents [(list(movie_reviews.words(fileid)), category) for category in movie_reviews.categories() for fileid in movie_reviews.fileids(category)]# 将documents「随机化」&#xff…