HDFS 的 Java API
涉及的主要类
在 Java 中操作 HDFS, 主要涉及以下 Class:
Configuration
该类的对象封转了客户端或者服务器的配置
FileSystem
该类的对象是一个文件系统对象, 可以用该对象的一些方法来对文件进行操作, 通过 FileSystem 的静态方法 get 获得该对象
FileSystem fs = FileSystem.get(conf)
get
方法从conf
中的一个参数fs.defaultFS
的配置值判断具体是什么类型的文件系统如果我们的代码中没有指定
fs.defaultFS
, 并且工程 ClassPath 下也没有给定相应的配置,conf
中的默认值就来自于 Hadoop 的 Jar 包中的core-default.xml
默认值为
file:///
, 则获取的不是一个 DistributedFileSystem 的实例, 而是一个本地文件系统的客户端对象
获取 FileSystem 的几种方式
第一种方式
复制代码
第二种方式
复制代码
第三种方式
复制代码
第四种方式
复制代码
遍历 HDFS 中所有文件
使用 API 遍历
复制代码
HDFS 上创建文件夹
复制代码
下载文件
复制代码
HDFS 文件上传
复制代码
评论