hadoop - 随笔分类 - DaBai的黑屋

Hadoop High Availability

摘要：一、 Hadoop High Availability HA(High Available), 高可用，是保证业务连续性的有效解决方案，一般有两个或两个以上的节点，分为活动节点（Active）及备用节点（Standby）。通常把正在执行业务的称为活动节点，而作为活动节点的一个备份的则称为备用节点。当阅读全文

posted @ 2019-09-14 20:13 DaBai的黑屋阅读(233) 评论(0) 推荐(0)

Hadoop集群动态扩容、缩容

摘要：一、 Hadoop集群动态扩容、缩容随着公司业务的增长，数据量越来越大，原有的datanode节点的容量已经不能满足存储数据的需求，需要在原有集群基础上动态添加新的数据节点。也就是俗称的动态扩容。有时候旧的服务器需要进行退役更换，暂停服务，可能就需要在当下的集群中停止某些机器上hadoop的服务阅读全文

posted @ 2019-09-14 18:23 DaBai的黑屋阅读(6898) 评论(0) 推荐(0)

Hadoop分布式文件系统---HDFS重点

摘要：介绍： HDFS （Hadoop Distributed File System）是 Hadoop 下的分布式文件系统，具有高容错、高吞吐量等特性，可以部署在低成本的硬件上。 HDFS 设计原理 HDFS 架构 HDFS 遵循主/从架构，由单个 NameNode(NN) 和多个阅读全文

posted @ 2019-09-14 18:11 DaBai的黑屋阅读(479) 评论(0) 推荐(0)

Hadoop总结：

摘要：Hadoop是什么？狭义上： HDFS：分布式文件存储系统 MapReduce：分布式计算框架 YARN：资源管理任务调度广义上： HDFS：分布式文件存储系统 MapReduce：分布式计算框架 YARN：资源管理任务调度特指apache一款由java开发，开源的大户数据处理平台软件 had 阅读全文

posted @ 2019-09-11 00:06 DaBai的黑屋阅读(278) 评论(0) 推荐(0)

HDFS的垃圾回收机制

摘要：hadoop hdfs 垃圾回收机制何为垃圾回收开启垃圾回收站把删除的文件首先放置在回收站中等待配置的时间结束进行真正的数据删除如何开始 vim core-site.xml<property><name>fs.trash.interval</name><value>1440</value 阅读全文

posted @ 2019-09-11 00:05 DaBai的黑屋阅读(1143) 评论(0) 推荐(0)

MapReduce jobHistory--结束日志

摘要：一、 MapReduce jobHistory JobHistory用来记录已经finished（结束）的mapreduce运行日志，日志信息存放于HDFS目录中，默认情况下没有开启此功能，需要在mapred-site.xml中配置并手动启动。 1．修改mapred-site.xml cd /ex 阅读全文

posted @ 2019-09-11 00:04 DaBai的黑屋阅读(485) 评论(0) 推荐(0)

hadoop初体验

摘要：hadoop初体验 namnode format操作首次启动集群需要针对hdfs 操作操作只需要进行一次通常在namenode所在节点进行 format中主要创建了hadoop运行时依赖的一些文件夹和文件 Storage directory /export/data/hadoopdata/df 阅读全文

posted @ 2019-09-11 00:03 DaBai的黑屋阅读(206) 评论(0) 推荐(0)

Hadoop2.x的安装与配置

摘要：Hadoop2.x的安装与配置（文档有详细）（一）Hadoop安装部署的预备条件安装Linux 安装JDK hadoop集群搭建 hadoop发行版本社区版：官方版本 apache社区维护优点：功能最新的免费缺点：稳定性兼容性不好 https://archive.apache.org/ 阅读全文

posted @ 2019-09-11 00:00 DaBai的黑屋阅读(1145) 评论(1) 推荐(1)

Hadoop简介

摘要：1． Hadoop介绍 Hadoop是Apache旗下的一个用java语言实现开源软件框架，是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。狭义上说，Hadoop指Apache这款开源框架，它的核心组件有： HDFS（分布式文件系统）：阅读全文

posted @ 2019-09-10 23:56 DaBai的黑屋阅读(4546) 评论(1) 推荐(1)

HDFS总结

摘要：是什么？分布式文件存储系统（是一个跨多台机器的文件存储系统） HDFS设计，特性：分布式：标准的主从架构（NameNode DataNode）一次写入多次读取：数据侧重于分析注重数据吞吐量，交互延迟高，不适合做网盘侧重于大文件存储，不利于小文件，小文件吃内存基本原理：对外如同一个黑盒子阅读全文

posted @ 2019-09-10 23:51 DaBai的黑屋阅读(256) 评论(0) 推荐(0)

hadoop学习

摘要：Hadoop家族：双中台架构：附件列表附件列表阅读全文

posted @ 2019-09-10 23:22 DaBai的黑屋阅读(151) 评论(0) 推荐(0)

大数据路线

摘要：hadoop科普 hadoop科普伪分布式搭建：阅读全文

posted @ 2019-09-10 23:20 DaBai的黑屋阅读(166) 评论(0) 推荐(0)

DaBai的黑屋

无法浪费时间，浪费的只是自己！

随笔分类 - hadoop

公告