【大数据学习篇3】HDFS命令操作与MR单词统计

news/2024/5/20 2:57:49 标签: hdfs, 大数据, 学习

1. HDFS命令使用

[root@master bin]# su hd
[hd@master bin]$ 
#查看/目录
[hd@master bin]$ hdfs dfs -ls /

5

#在/目录创建一个为test名字的文件夹
[hd@master bin]$ hdfs dfs -mkdir /test
#查看/目录
[hd@master bin]$ hdfs dfs -ls 
Found 1 items
drwxr-xr-x   - hd supergroup          0 2020-02-27 01:02 /test
#创建一个本地的txt文件
[hd@master ~]$ echo "abc123def456" > hello.txt 
#把创建的文件上传到hdfs
[hd@master ~]$ hdfs dfs -put hello.txt  / 
#在hdfs查看上传的文件
[hd@slave02 ~]$ hdfs dfs -cat /hello.txt
abc123def456
#下载hdfs文件到本地的linux当前目录
[hd@slave02 ~]$ ll
total 0
drwxrwxr-x. 4 hd hd 30 Feb 26 23:08 apps
#下载hdfs文件到当前目录
[hd@slave02 ~]$ hdfs dfs -get /hello.txt .
[hd@slave02 ~]$ ll
total 4
drwxrwxr-x. 4 hd hd 30 Feb 26 23:08 apps
-rw-r--r--. 1 hd hd 13 Feb 27 01:13 hello.txt
[hd@slave02 ~]$ 
[hd@slave02 ~]$ cat hello.txt 
abc123def456

 

MapReduct执行单词统计的程序

#创建文件
[hd@master ~]$ vi words.txt
Hello World Bye World
Hello Hadoop Bye Hadoop
Bye Hadoop Hello Hadoop
#上传文件
[hd@master ~]$ hdfs dfs -mkdir /word
[hd@master ~]$ hdfs dfs -put words.txt /word
#执行单词统计的样例
[hd@master hadoop]$ hadoop jar /home/hd/apps/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.0.jar wordcount /word/words.txt /out

http://www.niftyadmin.cn/n/312572.html

相关文章

阿里云 aliplayer 加密的视频 key解密解密下载过程实现

第一步:打开开发者工具 打开需要下载的视频链接,按F12打开开发者工具,然后强制刷新(ctrlf5) 第二步:定位key加密 内存搜索,关键词:_sce_dlgtqred 进入第二个结果:https…

git删除远程的提交记录

环境: 1、本地代码仓y12345678,远程代码仓origin\y12345678 2、修改代码1条记录,add-commit-push到origin\y12345678 3、修改代码另1条记录,add-commit-push到origin\y12345678 问题1,如何删除远程分支上origin\y1…

深入理解Java虚拟机:JVM高级特性与最佳实践-总结-2

深入理解Java虚拟机:JVM高级特性与最佳实践-总结-2 垃圾收集器与内存分配策略## 对象是否可以被回收再谈引用生存还是死亡? 垃圾收集算法分代收集理论 垃圾收集器与内存分配策略 ## 对象是否可以被回收 再谈引用 无论是通过引用计数算法判断对象的引用数量&…

VC++ GDI绘图操作

文章目录 GDI绘图DC获取DCCDC、HDC画笔和画刷画笔,绘制线条与轮廓画刷,填充封闭区域,绘制背景GDI绘图函数绘图区域更新GDI绘图 GDI是Graphics Device Interface的缩写,称为图形设备接口,主要用来绘图,由动态链接库GDI32.DLL提供支持。 GDI就是一个函数库,提供了很多绘图…

06-HTML-列表标签

1、 <ul> 标签定义无序列表。 2、<ol> 标签定义有序列表。 属性值描述compactcompact HTML5 中不支持。HTML 4.01 中不赞成使用。 规定列表呈现的效果比正常情况更小巧。 reversedreversed规定列表顺序为降序。(9,8,7...)startnumber规定有序列表的起始值。type 1A…

【JAVA面试】Zookeeper简单了解

提示&#xff1a;文章先作为初版&#xff0c;等后续时间充足后&#xff0c;补充更深的内容 文章目录 Zookeeper简单了解一、Zookeeper与Eureka区别二、Zookeeper集群中节点之间的数据如何同步三、Zookeeper集群领导者选取流程 Zookeeper简单了解 一、Zookeeper与Eureka区别 Z…

【大数据学习篇4】Hive安装与操作

1. 安装MariaDB 在Centos7使用Yum安装MariaDB 全部删除MySQL/MariaDB MySQL 已经不再包含在 CentOS 7 的源中&#xff0c;而改用了 MariaDB; 1.1 使用rpm -qa | grep mariadb搜索 MariaDB 现有的包&#xff1a; 如果存在&#xff0c;使用rpm -e --nodeps mariadb-*全部删除…

日志服务器的搭建

日志服务器 在centos7系统中&#xff0c;默认的日志系统是rsyslog&#xff0c;它是一类unix系统上使用的开源工具&#xff0c;用于在ip网络中转发日志信息&#xff0c;rsyslog采用模块化设计&#xff0c;是syslog的替代品。 rsyslog特点 实现了基本的syslog协议 直接兼容syslo…