Hadoop教程:HDFS操作

作者 : 开心源码 本文共836个字,预计阅读时间需要3分钟 发布时间: 2022-05-12 共146人阅读

启动HDFS

首先,您必需格式化配置的HDFS文件系统,打开namenode (HDFS服务器),并执行以下命令。

$ hadoop namenode -format 

格式化HDFS之后,启动分布式文件系统。下面的命令将启动namenode以及数据节点作为集群。

$ start-dfs.sh 

列出HDFS中的文件

在服务器中加载信息后,我们可以使用“ls”查找目录中的文件列表、文件状态。下面给出了可以作为参数传递到目录或者文件名的ls语法。

$ $HADOOP_HOME/bin/hadoop fs -ls <args>

将数据插入HDFS

假设我们在本地系统中一个名为file.txt的文件,应该保存在hdfs文件系统中。按照下面给出的步骤在Hadoop文件系统中插入所需的文件。

Step 1

您必需创立一个输入目录。

$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/input 

Step 2

使用put命令将数据文件从本地系统传输和存储到Hadoop文件系统。

$ $HADOOP_HOME/bin/hadoop fs -put /home/file.txt /user/input 

Step 3

您可以使用ls命令验证该文件。

$ $HADOOP_HOME/bin/hadoop fs -ls /user/input 

从HDFS检索数据

假设HDFS中有一个名为outfile的文件。下面是一个从Hadoop文件系统检索所需文件的简单演示。

Step 1

首先,使用cat命令查看来自HDFS的数据。

$ $HADOOP_HOME/bin/hadoop fs -cat /user/output/outfile 

Step 2

使用get命令将文件从HDFS获取到本地文件系统。

$ $HADOOP_HOME/bin/hadoop fs -get /user/output/ /home/hadoop_tp/ 

关闭HDFS

可以使用以下命令关闭HDFS

$ stop-dfs.sh 

原文链接:https://www.tutorialspoint.com/…

说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » Hadoop教程:HDFS操作

发表回复