06 2016 档案

摘要:MapReduce工作原理图文详解 一 MapReduce程序执行流程 程序执行流程图如下: 流程分析:1.在客户端启动一个作业。2.向JobTracker请求一个Job ID。3.将运行作业所需要的资源文件复制到HDFS上,包括MapReduce程序打包的JAR文件、配置文件和客户端计算所得的输入 阅读全文
posted @ 2016-06-28 16:17 老白条 阅读(360) 评论(0) 推荐(0)
摘要:1、创建目录命令 HDFS有一个默认的工作目录/user/$USER,其中$USER是用户的登录用户名。不过目录不会自动建立,需要mkdir建立它 命令格式:hadoop fs -mkdir 如: 在user目录下创建chen目录 hadoop fs -mkdir /user/chen 注意:Had 阅读全文
posted @ 2016-06-27 13:51 老白条 阅读(448) 评论(0) 推荐(0)
摘要:本文主要讲述 HDFS原理-架构、副本机制、HDFS负载均衡、机架感知、健壮性、文件删除恢复机制 1:当前HDFS架构详尽分析 HDFS架构 •NameNode •DataNode •Sencondary NameNode 数据存储细节 NameNode 目录结构 Namenode 的目录结构: $ 阅读全文
posted @ 2016-06-27 13:28 老白条 阅读(722) 评论(0) 推荐(0)
摘要:认识 Numa 架构 从系统架构来看,目前的商用服务器大体可以分为三类,即对称多处理器结构 (SMP : Symmetric Multi-Processor) ,非一致存储访问结构 (NUMA : Non-Uniform Memory Access) ,以及海量并行处理结构 (MPP : Massi 阅读全文
posted @ 2016-06-24 16:53 老白条 阅读(426) 评论(0) 推荐(0)
摘要:一、 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到,该参数不能自定 阅读全文
posted @ 2016-06-06 13:29 老白条 阅读(301) 评论(0) 推荐(0)