随笔分类 - hadoop
摘要:HDFS体系结构 master/slave架构 文件切分成块(128) namenode是主节点 DataNode在本地文件系统存储文件块数据,以及块数据的校验 NameNode Namenode是一个中心服务器,单一节点,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问文件操
阅读全文
摘要:一、HDFS核心设计 数据块(block) 数据块是HDFS上最基本的存储单位 HDFS块默认大小为128M 对块进行抽象会带来的好处 一个小文件的大小可以大于网络中任意一个磁盘的容量 使用块抽象而不是文件可以简化存储子系统 块非常适合用于数据备份进而提供数据容错能力和可用性 数据块复制 HDFS为
阅读全文
摘要:一、HDFS简介 1.HDFS:Hadoop distributed file system 一个分布式文件系统 基于流数据模式访问和处理超大文件的需要而开发 适合应用在大规模数据集上 2. 优点 处理超大文件 能用来存储管理PB级的数据 处理非结构化数据 流式的访问数据 一次写入、多次读写 运行于
阅读全文
摘要:一、大数据特征 1. 数据体量巨大 2. 数据类型多样(文本,图像,视频,音频) 3. 价值密度低,商业价值高 4.速度要求快,数据输出输入的速度 二、大数据之核心 1.数据的存储 2. 数据的计算(处理) 三、Hadoop 1. Apache开源软件基金会开发的 2. 运行于大规模普通服务器上的
阅读全文

浙公网安备 33010602011771号