HDFS概述及常用shell操作

news/2024/5/20 2:22:18 标签: hdfs, hadoop

HDFS

  • 一、HDFS概述
    • 1.1 HDFS适用场景
    • 1.2 HDFS优缺点
    • 1.3 HDFS文件块大小
  • 二、HDFS的shell操作
    • 2.1 上传
    • 2.2 下载
    • 2.3 HDFS直接操作

一、HDFS概述

1.1 HDFS适用场景

因为HDFS里所有的文件都是维护在磁盘里的
在磁盘中对文件的历史内容进行修改 效率极其低(但是追加可以)
在这里插入图片描述

1.2 HDFS优缺点

  • 优点
    -

  • 缺点
    因为数据量太大 且磁盘IO操作很多 所以不适合低延时的要求
    那HDFS为什么怕小文件呢-因为不管是大文件 还是小文件 他们对应的元数据信息大小都是一样的(大概150字节) 而元数据都是存在服务器的内存中 这是有限的
    在这里插入图片描述

1.3 HDFS文件块大小

在这里插入图片描述
在这里插入图片描述

二、HDFS的shell操作

2.1 上传

  • -moveFromLocal:从本地剪切粘贴到HDFS(本地就没了)
    hadoop fs -moveFromLocal ./test.txt /test

  • -copyFromLocal:从本地文件系统中拷贝文件到HDFS(本地还有)
    hadoop fs -copyFromLocal README.txt /test

  • -appendToFile:追加一个文件到已经存在的文件末尾
    hadoop fs -appendToFile liubei.txt /shuguo/kongming.txt

  • -put:等同于copyFromLocal
    hadoop fs -put ./test2.txt /test/

2.2 下载

  • -copyToLocal:从HDFS拷贝到本地
    hadoop fs -copyToLocal /sanguo/shuguo/kongming.txt ./
  • -get:等同于copyToLocal
    hadoop fs -get /sanguo/shuguo/kongming.txt ./
  • -getmerge:合并下载多个文件(把多个文件的内容合并放在一个文件)
    hadoop fs -getmerge /user/atguigu/test/* ./zaiyiqi.txt

2.3 HDFS直接操作

  • -ls: 显示目录信息
    hadoop fs -ls /

  • -mkdir:在HDFS上创建目录(-p创建多级目录)
    hadoop fs -mkdir -p /sanguo/shuguo

  • -cat:显示文件内容
    hadoop fs -cat /sanguo/shuguo/kongming.txt

  • -chgrp -chmod -chown:Linux文件系统中的用法一样 修改权限(Web可以直接改)

  • -cp :从HDFS的一个路径拷贝到HDFS的另一个路径
    hadoop fs -cp /sanguo/shuguo/kongming.txt /zhuge.txt

  • -mv:在HDFS目录中移动(重命名)文件
    hadoop fs -mv /zhuge.txt /sanguo/shuguo/

  • -tail:显示一个文件的末尾1kb的数据
    hadoop fs -tail /sanguo/kongming.txt

  • -rm:删除文件或文件夹
    hadoop fs -rm /user/atguigu/test/jinlian2.txt
    hadoop fs -rm -r 删文件夹

  • -rmdir:只能删除空目录
    hadoop fs -rmdir /test

  • -setrep:设置HDFS中文件的副本数量(这里设置的副本数只是记录在NameNode的元数据中 是否真的会有这么多副本 还得看DataNode的数量 因为目前只有3台设备 最多也就3个副本 只有节点数的增加到10台时 副本数才能达到10)
    hadoop fs -setrep 10 /sanguo/kongming.txt


http://www.niftyadmin.cn/n/5438598.html

相关文章

模拟计算机和数字计算机

抽象符号只是对现实世界的描述而非模拟,这种描述的还原依赖于人脑对自然世界的物理共识,当你说 “这是山” 这三个简单的字时,听者会还原出一座大山的具象… 人们早在 70 多年前就习惯了以二进制 0 和 1 为基础的数字逻辑,开启了数…

AcWing 1355. 母亲的牛奶 (BFS)

农夫约翰有三个容量分别为 A , B , C A,B,C A,B,C 升的挤奶桶。 最开始桶 A A A 和桶 B B B 都是空的,而桶 C C C 里装满了牛奶。 有时,约翰会将牛奶从一个桶倒到另一个桶中,直到被倒入牛奶的桶满了或者倒出牛奶的桶空了为止。 这一过…

面试宝典:MySQL 索引优化

在数据库的世界里,索引是提升查询效率的关键。对于高级开发者来说,理解并能够优化MySQL索引是提升应用性能的重要技能。本文将深入探讨MySQL索引的原理、类型以及优化策略,帮助你在面试中脱颖而出。 索引的基本原理 MySQL中的索引基于B+树(Balanced Tree)数据结构,它提…

Linux运维_Linux临时环境变量设置(bin和include以及lib)

Linux运维_Linux临时环境变量设置(bin和include以及lib) 在 Linxu 系统上设置用户环境变量可以通过编辑用户的 profile 环境变量配置文件或者 .bashrc Shell配置文件来实现。 bashrc 与 profile 的区别: bashrc: 每个脚本执行前都执行一遍这个脚本。 profile: 在系统登录后执…

电子科技大学链时代工作室招新题C语言部分---题号G

1. 题目 问题的第一段也是非常逆天,说实话,你编不出问题背景可以不编。 这道题的大概意思就是, Pia要去坐飞机,那么行李就有限重。这时Pia想到自己带了个硬盘,众所周知,硬盘上存储的数据就是0和1的二进制序…

Scala--01--简介、环境搭建

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1. Scala简介1.1 Scala是什么?官网: [https://scala-lang.org/](https://scala-lang.org/)官方文档: [https://docs.scala-lang.…

day22|leetcode|C++|235. 二叉搜索树的最近公共祖先|701. 二叉搜索树中的插入操作|450. 删除二叉搜索树中的节点

今朝剑指叠云处,爱蛊爱人还爱天 Leetcode 235. 二叉搜索树的最近公共祖先 链接:235. 二叉搜索树的最近公共祖先 thought: 二叉搜索树的特性 k神向下找思路,当p,q都在当前root的右子树时,则遍历至root->right 当 p,q 都在 …

拦截器(springboot)

1、拦截器介绍 在SpringBoot中,拦截器是一种用于拦截请求并在处理请求之前或之后执行特定操作的机制。 拦截器可以用于实现一些通用的功能,例如身份验证、日志记录、性能监控等。 Springboot中的拦截器是通过实现HandlerInterceptor接口来实现的&#x…