随笔分类 - 大数据
Hadoop基础之MapReduce中Shuffle
摘要:Hadoop基础之MapReduce中Shuffle Hadoop基础之MapReduce中Shuffle shuffle maptask:map端可以执行的一个进程 reducetask:reduce端可以执行的一个进程 shuffle是介于maptask和reducetask之间的一个过程 sh
阅读全文
Hadoop基础之MapReduce词频分析
摘要:Hadoop基础之MapReduce词频分析 Hadoop基础之MapReduce词频分析 需求 把需要的数据分离出来 确定key和value 确定泛型 代码 App类 package mapReduce.phoneTraffic.testOne.app; import mapReduce.comm
阅读全文
Hadoop基础之MapReduce
摘要:Hadoop基础之MapReduce Hadoop基础之MapReduce MapReduce MapReduce是hadoop中的一个非常重要的组件,用来处理海量数据计算的组件 由来:谷歌论文"MapReduce" 从论文的角度分析:MapReduce是一种思想 从技术的角度分析:MapReduc
阅读全文
Hadoop基础之新节点的服役与旧节点的退役
摘要:Hadoop基础之新节点的服役与旧节点的退役 Hadoop基础之新节点的服役与旧节点的退役 修改节点之停止服务修改 停止服务 配制ssh免密登录 修改同步脚本 修改hosts文件 修改slaves文件 格式化 重新启动服务 修改节点之热部署修改 服役新节点 创建一个新节点、修改IP、主机名 配制ss
阅读全文
Hadoop基础之机架感知
摘要:Hadoop基础之机架感知 Hadoop基础之机架感知 什么是机架感知 机架:存放服务器的架子,也叫机柜。一般来说一个机房有很多机柜,每个机柜有很多服务器 感知策略 Hadoop1版本 客户端依据最近空闲原则选择一个节点,在不同机架上选择第二个节点,在第二个节点的同机架下选择第三个节点 Hadoop
阅读全文
Hadoop基础之HDFS
摘要:HDFS Hadoop基础之HDFS 什么是HDFS Hadoop Distributed File System hadoop的分布式文件系统 文件系统: 个人理解:在磁盘(只能做存储)的基础上,使用软件对所存储的内容进行管理的,这个软件就叫做文件系统 百度百科:文件系统是操作系统用于明确存储设备
阅读全文
Hadoop基础之环境搭建
摘要:Hadoop基础之环境搭建 环境搭建 本地环境 可以用于开发的单节点模式,没有分布式的概念 伪分布式环境 一个节点表示一整个集群,但是分布式的概念,一个节点充当分布式里的所有角色 完全分布式 一个集群中有N个节点,他们分别充当分布式中不同的角色,完成不同的任务 伪分布式环境搭建 下载安装包 Hado
阅读全文
Hadoop基础之Hadoop概述
摘要:Hadoop基础之Hadoop概述 Hadoop基础之Hadoop概述 什么是Hadoop Hadoop是一个可靠的、可扩展的,可以分布式计算的开源软件(计算框架) 使用简单模型在集群中分布式处理海量数据 集群:从硬件的角度分析 分布式:从软件的角度分析 节点的数量可以从单一一个服务到成千上万个服务
阅读全文
大数据之大数据基础
摘要:大数据基础 大数据基础 什么是大数据 数据 字母、数字、声音、影像等都是数据,数据本身没有任何意义 数据是信息的载体 信息 信息是在数据的基础上,经过解释加工,得到了一定的价值,叫做信息 信息量 消除人们对不确定因素的大小 大 数据量大,如果想取得更大的价值,数据量要大,量变引起质变。数据量越多,可
阅读全文
浙公网安备 33010602011771号