HDFS - 随笔分类 - DaBai的黑屋

Hadoop High Availability

摘要：一、 Hadoop High Availability HA(High Available), 高可用，是保证业务连续性的有效解决方案，一般有两个或两个以上的节点，分为活动节点（Active）及备用节点（Standby）。通常把正在执行业务的称为活动节点，而作为活动节点的一个备份的则称为备用节点。当阅读全文

posted @ 2019-09-14 20:13 DaBai的黑屋阅读(233) 评论(0) 推荐(0)

Hadoop分布式文件系统---HDFS重点

摘要：介绍： HDFS （Hadoop Distributed File System）是 Hadoop 下的分布式文件系统，具有高容错、高吞吐量等特性，可以部署在低成本的硬件上。 HDFS 设计原理 HDFS 架构 HDFS 遵循主/从架构，由单个 NameNode(NN) 和多个阅读全文

posted @ 2019-09-14 18:11 DaBai的黑屋阅读(479) 评论(0) 推荐(0)

HDFS的快照

摘要：HDFS的快照一个snapshot（快照）是一个全部文件系统、或者某个目录在某一时刻的镜像快照应用在如下场景中：防止用户的错误操作备份试验/测试灾难恢复 HDFS的快照操作开启快照 hdfs dfsadmin -allowSnapshot /input 创建快照 hdfs dfs -c 阅读全文

posted @ 2019-09-11 00:08 DaBai的黑屋阅读(495) 评论(0) 推荐(0)

HDFS总结

摘要：是什么？分布式文件存储系统（是一个跨多台机器的文件存储系统） HDFS设计，特性：分布式：标准的主从架构（NameNode DataNode）一次写入多次读取：数据侧重于分析注重数据吞吐量，交互延迟高，不适合做网盘侧重于大文件存储，不利于小文件，小文件吃内存基本原理：对外如同一个黑盒子阅读全文

posted @ 2019-09-10 23:51 DaBai的黑屋阅读(256) 评论(0) 推荐(0)

HDFS架构

摘要：HDFS架构 NameNode DataNode Secondary NameNode 元数据存储细节  一、NameNode 是整个文件系统的管理节点。它维护着整个文件系统的文件目录树，文件/目录的元信息和每个文件对应的数据块列表。接收用户的操作请求。文件包括： hdfs-s 阅读全文

posted @ 2019-09-10 23:50 DaBai的黑屋阅读(175) 评论(0) 推荐(0)

hadoop archive的使用

摘要：hadoop archive的使用产生背景：hdfs架构设计不利于小文件存储文件不管多小都需要元数据描述记录如果集群小文件过多可能磁盘使用情况很低但是内存使用确很高俗称小文件吃内存档案的功能：通过mr程序把多个小文件合并成一个档案文件 archive的使用档案的创建 hado 阅读全文

posted @ 2019-09-10 23:49 DaBai的黑屋阅读(459) 评论(0) 推荐(0)

HDFS的底层原理

摘要：HDFS的底层原理 HDFS的底层通信原理采用的是：RPC和动态代理对象Proxy（一）RPC 什么是RPC？ Remote Procedure Call，远程过程调用。也就是说，调用过程代码并不是在调用者本地运行，而是要实现调用者与被调用者二地之间的连接与通信。RPC的基本通信模型是基于Clien 阅读全文

posted @ 2019-09-10 23:47 DaBai的黑屋阅读(507) 评论(0) 推荐(0)

HDFS安全模式

摘要：HDFS的安全模式什么是安全模式？ 安全模式是hadoop的一种保护机制，用于保证集群中的数据块的安全性。如果HDFS处于安全模式，则表示HDFS是只读状态。当集群启动的时候，会首先进入安全模式。当系统处于安全模式时会检查数据块的完整性。假设我们设置的副本数（即参数dfs. 阅读全文

posted @ 2019-09-10 23:45 DaBai的黑屋阅读(650) 评论(1) 推荐(0)

HDFS的Java API

摘要：HDFS Java API 一、简介想要使用 HDFS API，需要导入依赖 hadoop-client。如果是 CDH 版本的 Hadoop，还需要额外指明其仓库地址：二、API的使用 2.1 FileSystem FileSystem 是所有 HDFS 操作的主入口。由于之后的每个单元测试阅读全文

posted @ 2019-09-10 23:43 DaBai的黑屋阅读(311) 评论(0) 推荐(0)

HDFS写流程

摘要：1.1． HDFS写数据流程  详细步骤解析： 1、client发起文件上传请求，通过RPC与NameNode建立通讯，NameNode检查目标文件是否已存在，父目录是否存在，返回是否可以上传； 2、client请求第一个 block该传输到哪些DataNode服务器上； 3、阅读全文

posted @ 2019-09-10 23:41 DaBai的黑屋阅读(161) 评论(0) 推荐(0)

HDFS读流程

摘要：1.1． HDFS读数据流程详细步骤解析： 1、 Client向NameNode发起RPC请求，来确定请求文件block所在的位置； 2、 NameNode会视情况返回文件的部分或者全部block列表，对于每个block，NameNode都会返回含有该block副本的DataNode地址； 3、阅读全文

posted @ 2019-09-10 23:40 DaBai的黑屋阅读(248) 评论(0) 推荐(0)

HDFS工作机制

摘要：NameNode负责管理整个文件系统元数据。DataNode负责管理具体的文件数据块存储！Secondary NameNode 协助NameNode进行元数据备份！客户端访问HDFS都是通过向NameNode申请进行 <wiz_tmp_tag id="wiz-table-range-border" 阅读全文

posted @ 2019-09-10 23:39 DaBai的黑屋阅读(144) 评论(0) 推荐(0)

HDFS基本原理

摘要：1． NameNode概述 a、NameNode是HDFS的核心。 b、NameNode也称为Master。 c、NameNode仅存储HDFS的元数据：文件系统中所有文件的目录树，并跟踪整个集群中的文件。 d、NameNode不存储实际数据或数据集。数据本身实际存储在DataNodes中。 e、N 阅读全文

posted @ 2019-09-10 23:35 DaBai的黑屋阅读(175) 评论(0) 推荐(0)

文件限额

摘要：hdfs文件的限额配置允许我们以文件大小或者文件个数来限制在某个目录下上传的文件数量或者文件内容总量，以便达到类似百度网盘网盘等限制每个用户允许上传的最大的文件的量。 1.1．数量限额执行以下命令进行文件数量限额 hadoop fs -mkdir -p /user/root/lisi #创建hd 阅读全文

posted @ 2019-09-10 23:31 DaBai的黑屋阅读(376) 评论(0) 推荐(0)

Shell命令

摘要：具体操作：具体操作： hadoop fs -ls file:/// 访问是本地系统 1.1． Shell 命令选项选项名称使用格式含义 -ls -ls <路径> 查看指定路径的当前目录结构 -lsr -lsr <路径> 递归查看指定路径的目录结构 -du -du <路径> 统计目录下个文件大阅读全文

posted @ 2019-09-10 23:29 DaBai的黑屋阅读(601) 评论(0) 推荐(0)

HDFS基本概念

摘要：HDFS简介： HDFS特性：首先是一个文件系统，用于存储文件，提供统一的命名空间的目录树结构便于用户操作文件系统！其次，他是一个分布式文件存储系统，分布式意味着多台机器当中不同的角色各司其职，共同配合！ master/slave主从架构：分块存储： HDFS中的文阅读全文

posted @ 2019-09-10 23:26 DaBai的黑屋阅读(189) 评论(0) 推荐(0)

DaBai的黑屋

无法浪费时间，浪费的只是自己！

随笔分类 - HDFS

公告