HDFS读取与写入步骤详解

news/2024/5/20 4:09:18 标签: hdfs, hadoop, big data

HDFS读取与写入步骤详解

1、Hadoop写流程

Hadoop写流程主要实现将文件上传到HDFS中,其指令格式如下所示:

#hadoop上传文件语法
hdfs dfs -put localpath  hdfspath 

其上传步骤可以分为以下八个步骤:

请添加图片描述

  1. 客户端通过Distributed FileSystem模块NameNode请求上传文件,NameNode检查目标文件是否已存在,父目录是否存在。
  2. NameNode返回是否可以上传
  3. 客户端请求第一个 Block上传到哪几个DataNode服务器上。
  4. NameNode返回3个DataNode节点,分别为dn1、dn2、dn3。
  5. 客户端通过FSDataOutputStream模块请求dn1上传数据,dn1收到请求会继续调用dn2,然后dn2调用dn3,将这个通信管道建立完成。
  6. dn1、dn2、dn3逐级应答客户端。
  7. 客户端开始往dn1上传第一个Block(先从磁盘读取数据放到一个本地内存缓存),以Packet为单位,dn1收到一个Packet就会传给dn2,dn2传给dn3;dn1每传一个packet会放入一个应答队列等待应答。
  8. 当一个Block传输完成之后,客户端再次请求NameNode上传第二个Block的服务器。(重复执行3-7步)

2、Hadoop读流程

Hadoop读流程主要实现将文件从HDFS中下载下来。

请添加图片描述

  1. 客户端通过Distributed FileSystemNameNode请求下载文件,NameNode通过查询元数据,找到文件块所在的DataNode地址。
  2. 挑选一台**DataNode(就近原则,然后随机)**服务器,请求读取数据。
  3. DataNode开始传输数据给客户端(从磁盘里面读取数据输入流,以Packet为单位来做校验)。
  4. 客户端以Packet为单位接收,先在本地缓存,然后写入目标文件。

http://www.niftyadmin.cn/n/1616034.html

相关文章

Instapaper 4.0登陆苹果

让我们长话短说吧:这是阅读应用Instapaper的一次重要更新。 (等不及了吧? 点击此处前往App Store link下载尝鲜吧。) 导航 重新设计了iPad浏览接口,新版本为对触摸操作更友好的网格设计,在任何方向均可实现导航。 在iPad上的显示效…

Hadoop的存储策略

Hadoop的存储策略 策略 ID策略名称块分布creationFallbacksreplicationFallbacks15Lazy_PersistRAM_DISK: 1, DISK: n-1DISKDISK12All_SSDSSD: nDISKDISK10One_SSDSSD: 1, DISK: n-1SSD, DISKSSD, DISK7Hot (default)DISK: n< none >ARCHIVE5WarmDISK: 1, ARCHIVE: n-1A…

用户称iPhone 4S没有想象的给力

虽然苹果公司现在说iPhone 4S销量不错&#xff0c;但不是每个使用的它人都用得那么开心。使用过程中&#xff0c;不管是语音助手Siri还是电池&#xff0c;还是网速&#xff0c;都出现了一些问题&#xff0c;而且iOS5的首次使用也带来诸多不便&#xff0c;以下是iPhone 4S不如人…

健康减肥4+1:一人减肥抗不住,一起运动不孤单

健康减肥4加1是健康减肥SNS网站:健康4加1为手机用户量身定做的自动追踪运动和卡路里消耗的健康减肥小助手。在这里&#xff0c;可以借助此应用捕获自己运动所消耗的热量&#xff0c;自动更新到用户的空间并与新浪微博、腾讯微博、人人网同步。 准确地记录用户的运动情况&#x…

千元平板乐Pad A1完整拆解视频

联想平板电脑乐Pad A1最近广告打得挺猛&#xff0c;且售价仅为1千元&#xff0c;确实是够便宜的&#xff0c;同时还挂着全球第二大PC厂商联想的牌子&#xff0c;够诱人了吧。 俗话说&#xff1a;好货不便宜&#xff0c;便宜没有好货。联想会否打破俗语&#xff0c;给我们惊喜呢…

徐冰洋点评联想乐Pad A1

就在我们将联想的乐Pad拆解之后&#xff0c;我们请来了手机和平板领域钻研多年的徐冰洋先生&#xff0c;为我们本次的拆机做一个总结性的点评。 徐冰洋先生表示&#xff0c;在联想乐Pad A1这款千元平板出现之后&#xff0c;诸多山寨平板厂商纷纷降价&#xff0c;原因不是因为这…

利用Java API实现Kafka的生产者消费者

一、功能描述 利用Java连接Kafka&#xff0c;通过API实现生产者和消费者&#xff0c;对于Kafka生产或者消费数据。将日志信息进行输出。 二、依赖导入 首先&#xff0c;创建一个简单的maven的工程并将依赖导入 <dependency><groupId>org.apache.kafka</grou…

当投影仪取代游戏机

各位爱玩的朋友&#xff0c;这回又有新玩具了&#xff0c;这是Disney Research研究出来的&#xff0c;一个微型投影机&#xff0c;让投射在墙上的图像能够有互动。该设备输出可见的红外线&#xff0c;内置的感应装置可以来侦测红外线&#xff0c;并让其对图像做出反馈。 该团队…