利用Java实现HDFS文件上传下载

news/2024/5/20 4:51:52 标签: hdfs, java, hadoop, big data

文章目录

  • 利用Java实现HDFS文件上传下载
    • 1、pom.xml配置
    • 2、创建与删除
    • 3、文件上传
    • 4、文件下载

利用Java实现HDFS文件上传下载

1、pom.xml配置

<!--配置-->
<properties>
	<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
	<maven.compiler.source>1.8</maven.compiler.source>
    <maven.compiler.target>1.8</maven.compiler.target>
    <hadoop.version>3.1.3</hadoop.version>
</properties>
<!--依赖库-->
<dependencies>
	<dependency>
		<groupId>org.apache.hadoop</groupId>
      	<artifactId>hadoop-common</artifactId>
      	<version>${hadoop.version}</version>
    </dependency>
    <dependency>
     	<groupId>org.apache.hadoop</groupId>
      	<artifactId>hadoop-mapreduce-client-core</artifactId>
      	<version>${hadoop.version}</version>
    </dependency>
</dependencies>

2、创建与删除

java">//导包
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import java.io.IOException;
public static void main( String[] args ){
    //初始化hadoop文件系统的configration对象
	Configuration conf = new Configuration();
    //将hadoop的configration信息传入
	conf.set("fs.defaultFS","hdfs://192.168.50.102:9000");
    //初始化Hadoop文件系统的句柄
	FileSystem fs=null;
    try {
        //配置Hadoop的文件句柄信息
		fs=FileSystem.get(conf);
        //定义Hadoop的文件路径
        final String PATH="/test/kb16/hadoop/ratings.csv";
        //初始化Hadoop的路径信息
        Path path = new Path(PATH);
        //如果文件路径存在就删除
		if (fs.exists(path)) {
			System.out.println("DELETE "+fs.delete(path, true));
		}else{
            //如果文件路径不存在就创建
			System.out.println("CREATE "+fs.create(path));
		}
	} catch (IOException e) {
		e.printStackTrace();
	}finally {
        //结束的时候,句柄还没有释放就进行释放
		if (fs!=null) {
			try {
				fs.close() ;
			}catch (IOException e) {
				e.printStackTrace();
			}
		}
	}
}

3、文件上传

java">//导包
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import java.io.File;
import java.io.IOException;
public static void main(String[] args) {
    //定义本地上传文件路径
	final String formPath="E:\\ratings.csv";
    //本地文件不存在就报错,并强制让程序终止
    if (!new File(formPath).exists()) {
		System.out.println(formPath +"doesn't exits");
        return;
	}
    //初始化hadoop文件系统的configration对象
	Configuration conf = new Configuration();
    //将hadoop的configration信息传入
    conf.set("fs.defaultFS","hdfs://192.168.50.102:9000");
    //初始化Hadoop文件系统的句柄
	FileSystem fs=null;
    try {
        //将config信息传入
		fs=FileSystem.get(conf);
        //定义上传到HDFS的路径
		final String toPath="/test/kb16/hive";
        //初始化路径
		Path to =new Path(toPath);
        //如果文件路径存在不执行,如果文件路径不存在就尝试创建,如果创建失败就跳过
      	if (!fs.exists(to)&& !fs.mkdirs(to)) {
			System.out.println(toPath +"doesn't exit and can't be created");
			return;
		}
        //初始化上传文件路径
		Path from=new Path(formPath);
        //利用方法将本地文件复制到HDFS中
		fs.copyFromLocalFile(from, to);
		System.out.println("succeed in copying from "+formPath+" to "+toPath);
	} catch (IOException e) {
		e.printStackTrace();
		System.out.println("FAILURE");
	}finally{
        //如果结束Hadoop文件系统句柄没有关闭,利用方法进行句柄释放
		if (null!=fs) {
			try {
				fs.close();
			} catch (IOException e) {
				e.printStackTrace();
			}
        }
    }
}

4、文件下载

java">//导包
import com.google.inject.internal.cglib.core.$LocalVariablesSorter;
import com.google.inject.internal.cglib.proxy.$Factory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import java.io.File;
import java.io.IOException;
public class Download {
    public static void main(String[] args) {
        //定义文件下载路径
        final String toPath = "C:\\Users\\Jialin\\Desktop";
        //获取路径
        File to = new File(toPath);
        //如果路存在或者文件路径不存在但是创建成功就不执行if方法
        if (!to.exists()&&!to.mkdirs()) {
            System.err.println(toPath + "doesn't exist and can't be created");
            return;
        }
        //初始化hadoop文件系统的configration对象
        Configuration config = new Configuration();
        //将hadoop的configration信息传入
        config.set("fs.defaultFS", "hdfs://192.168.50.102:9000");
        //初始化Hadoop文件系统的句柄
        FileSystem fs = null;
        try {
            //将config信息传入
            fs = FileSystem.get(config);
            //定义下载文件路径
            final String fromPath = "/test/kb16/hive/ratings.csv";
            //获取路径信息
            Path from = new Path(fromPath);
            //如果指定下载文件不存在就退出
            if (!fs.exists(from)) {
                System.err.println(toPath + "doesn't exist ");
                return;
            }
			//获取文件下载路径信息
            Path _to = new Path(toPath);
            //利用方法将Hadoop文件下载到本地
            fs.copyToLocalFile(from,_to);
            System.out.println("succeed in downloading from "+fromPath+" to"+toPath);
        } catch (IOException e) {
            e.printStackTrace();
            System.out.println("FAILURE");
        } finally {
            //如果结束Hadoop文件系统句柄没有关闭,利用方法进行句柄释放
            if (null != fs)
                try {
                    fs.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
        }
    }
}

http://www.niftyadmin.cn/n/1616035.html

相关文章

HDFS读取与写入步骤详解

HDFS读取与写入步骤详解 1、Hadoop写流程 Hadoop写流程主要实现将文件上传到HDFS中&#xff0c;其指令格式如下所示&#xff1a; #hadoop上传文件语法 hdfs dfs -put localpath hdfspath 其上传步骤可以分为以下八个步骤&#xff1a; 客户端通过Distributed FileSystem模块…

Instapaper 4.0登陆苹果

让我们长话短说吧&#xff1a;这是阅读应用Instapaper的一次重要更新。 (等不及了吧&#xff1f; 点击此处前往App Store link下载尝鲜吧。) 导航 重新设计了iPad浏览接口&#xff0c;新版本为对触摸操作更友好的网格设计&#xff0c;在任何方向均可实现导航。 在iPad上的显示效…

Hadoop的存储策略

Hadoop的存储策略 策略 ID策略名称块分布creationFallbacksreplicationFallbacks15Lazy_PersistRAM_DISK: 1, DISK: n-1DISKDISK12All_SSDSSD: nDISKDISK10One_SSDSSD: 1, DISK: n-1SSD, DISKSSD, DISK7Hot (default)DISK: n< none >ARCHIVE5WarmDISK: 1, ARCHIVE: n-1A…

用户称iPhone 4S没有想象的给力

虽然苹果公司现在说iPhone 4S销量不错&#xff0c;但不是每个使用的它人都用得那么开心。使用过程中&#xff0c;不管是语音助手Siri还是电池&#xff0c;还是网速&#xff0c;都出现了一些问题&#xff0c;而且iOS5的首次使用也带来诸多不便&#xff0c;以下是iPhone 4S不如人…

健康减肥4+1:一人减肥抗不住,一起运动不孤单

健康减肥4加1是健康减肥SNS网站:健康4加1为手机用户量身定做的自动追踪运动和卡路里消耗的健康减肥小助手。在这里&#xff0c;可以借助此应用捕获自己运动所消耗的热量&#xff0c;自动更新到用户的空间并与新浪微博、腾讯微博、人人网同步。 准确地记录用户的运动情况&#x…

千元平板乐Pad A1完整拆解视频

联想平板电脑乐Pad A1最近广告打得挺猛&#xff0c;且售价仅为1千元&#xff0c;确实是够便宜的&#xff0c;同时还挂着全球第二大PC厂商联想的牌子&#xff0c;够诱人了吧。 俗话说&#xff1a;好货不便宜&#xff0c;便宜没有好货。联想会否打破俗语&#xff0c;给我们惊喜呢…

徐冰洋点评联想乐Pad A1

就在我们将联想的乐Pad拆解之后&#xff0c;我们请来了手机和平板领域钻研多年的徐冰洋先生&#xff0c;为我们本次的拆机做一个总结性的点评。 徐冰洋先生表示&#xff0c;在联想乐Pad A1这款千元平板出现之后&#xff0c;诸多山寨平板厂商纷纷降价&#xff0c;原因不是因为这…

利用Java API实现Kafka的生产者消费者

一、功能描述 利用Java连接Kafka&#xff0c;通过API实现生产者和消费者&#xff0c;对于Kafka生产或者消费数据。将日志信息进行输出。 二、依赖导入 首先&#xff0c;创建一个简单的maven的工程并将依赖导入 <dependency><groupId>org.apache.kafka</grou…