第五周学习总结

HDFS分布式文件系统基础

文件系统是存储和组织数据的方法

传统单机文件系统

数据：存储的内容本身

元数据：记录数据的数据

分布式存储系统的核心属性及功能作用.

1.分布式存储的优点：无限扩展

单机纵向扩展

多机横向扩展

2.元数据记录的功能

快速定位文件位置

3.文件分块存储

针对块并行操作提高效率

4.副本机制的作用

荣誉存储，保障数据安全

HDFS分布式文件系统

故障检测和自动快速恢复

用于批处理，一次写入多次读取，低成本部署

重要特性

主从结构

Namenode为主节点

Datanode是从节点

分布存储

副本机制

元数据记录

抽象统一的目录树结构

HDFS shell命令行

hadoop fs -ls file：本地文件操作系统

hadoop fs -ls hdfs： hdfs文件操作系统

/ fs.defalut 默认配置

HDFS shell命令行常用操作

hadoop fs -mkdir [-p]<path> 创建文件夹

hadoop fs -ls[-h][-R][<path>] 查看指定目录下内容

haddoop fs -put[-f][-p]<localsrc>---<dst> 上传文件到HDFS指定目录下

hadoop fs -cat<src>... 查看HDFS文件内容

hadoop fs -get[-f][-p]<src>...<localdst>下载HDFS文件

hadoop fs -cp[-f]<src>...<dst> -f覆盖目标文建件拷贝HDFS文件

hadoop fs -appendToFile<localsrc>...<dst> 追加数据到HDFS文件中

hadoop fs -mv<src>...<dst> HDFS数据移动操作

HDFS工作流程与机制

各角色职责介绍与梳理

namenode 主角色大内存

datanode 从角色大磁盘

上传数据流程

pipeline管道

ack应答响应

默认3副本存储策略

posted @ 2023-08-12 23:02 代不动码阅读(17) 评论(0) 收藏举报

刷新页面返回顶部

jy-all-bug

第五周学习总结

公告