2025/2/3

HDFS(Hadoop Distributed File System)是Hadoop的核心组件之一,用于存储大规模数据集。本篇博客将介绍如何使用HDFS进行数据存储和管理。
HDFS架构:NameNode和DataNode的角色。
HDFS操作:上传、下载、查看文件。
示例代码:

# 查看HDFS中的文件
hdfs dfs -ls /

# 创建目录
hdfs dfs -mkdir /user/hadoop/input

# 上传文件到HDFS
hdfs dfs -put /path/to/local/file.txt /user/hadoop/input/

# 查看文件内容
hdfs dfs -cat /user/hadoop/input/file.txt

# 下载文件到本地
hdfs dfs -get /user/hadoop/input/file.txt /path/to/local/

# 删除文件
hdfs dfs -rm /user/hadoop/input/file.txt
运行步骤:
确保Hadoop服务已启动。
使用上述命令操作HDFS文件系统。
观察命令行输出结果。

HDFS提供了强大的分布式存储功能,支持大规模数据的存储和管理。通过简单的命令行操作,可以轻松管理HDFS中的文件。

posted @ 2025-02-03 13:41  伐木工熊大  阅读(10)  评论(0)    收藏  举报