2016 年 6月随笔档案 - 老白条

MapReduce 1工作原理图文详解

摘要：MapReduce工作原理图文详解一 MapReduce程序执行流程程序执行流程图如下：流程分析：1.在客户端启动一个作业。2.向JobTracker请求一个Job ID。3.将运行作业所需要的资源文件复制到HDFS上，包括MapReduce程序打包的JAR文件、配置文件和客户端计算所得的输入阅读全文

posted @ 2016-06-28 16:17 老白条阅读(360) 评论(0) 推荐(0)

HDFS的常用操作

摘要：1、创建目录命令 HDFS有一个默认的工作目录/user/$USER，其中$USER是用户的登录用户名。不过目录不会自动建立，需要mkdir建立它命令格式：hadoop fs -mkdir 如：在user目录下创建chen目录 hadoop fs -mkdir /user/chen 注意：Had 阅读全文

posted @ 2016-06-27 13:51 老白条阅读(448) 评论(0) 推荐(0)

HDFS 原理、架构与特性介绍

摘要：本文主要讲述 HDFS原理-架构、副本机制、HDFS负载均衡、机架感知、健壮性、文件删除恢复机制 1：当前HDFS架构详尽分析 HDFS架构 •NameNode •DataNode •Sencondary NameNode 数据存储细节 NameNode 目录结构 Namenode 的目录结构： $ 阅读全文

posted @ 2016-06-27 13:28 老白条阅读(722) 评论(0) 推荐(0)

SMP、NUMA、MPP体系结构介绍

摘要：认识 Numa 架构从系统架构来看，目前的商用服务器大体可以分为三类，即对称多处理器结构 (SMP ： Symmetric Multi-Processor) ，非一致存储访问结构 (NUMA ： Non-Uniform Memory Access) ，以及海量并行处理结构 (MPP ： Massi 阅读全文

posted @ 2016-06-24 16:53 老白条阅读(426) 评论(0) 推荐(0)

hive优化之------控制hive任务中的map数和reduce数

摘要：一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定阅读全文

posted @ 2016-06-06 13:29 老白条阅读(301) 评论(0) 推荐(0)

06 2016 档案

公告