随笔分类 - Hadoop
摘要:转自:https://www.cnblogs.com/caiyisen/p/7395843.html 学习完Hadoop权威指南有一段时间了,现在再回顾和总结一下HDFS的知识点。 1、HDFS的设计 HDFS是什么:HDFS即Hadoop分布式文件系统(Hadoop Distributed Fil
阅读全文
摘要:转载自:https://www.cnblogs.com/hanzhi/articles/8969109.html 1. hadoop 生态概况 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和
阅读全文
摘要:前言: HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化9的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类
阅读全文
摘要:前言: ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。 ZooKeeper的目标就是封装好复杂易
阅读全文
摘要:转自:https://www.cnblogs.com/linjiqin/archive/2013/03/05/2944510.html HiveQL是一种类似SQL的语言, 它与大部分的SQL语法兼容, 但是并不完全支持SQL标准, 如HiveQL不支持更新操作, 也不支持索引和事务, 它的子查询和
阅读全文
摘要:前言: hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行 运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十
阅读全文
摘要:一、hadoop-eclipse-plugin-2.7.3.jar插件下载点击下载 二、把插件放到eclipse的安装目录dropins下 三、eclipse上的配置 3.1 打开Window-->Persperctive-->Other 3.2 选择MAP\/Reduce,点击OK 3.3 点击图
阅读全文
只有注册用户登录后才能阅读该文。
摘要:转载自 :http://blog.csdn.net/gis_101/article/details/52679914 1、问题背景 操作系统:CentOS7 64位 Hadoop版本:Hadoop2.7.3 JDK:1.8.0_65 2、问题描述 使用start-all.sh脚本或者先后执行star
阅读全文
摘要:Hadoop历史 Hadoop历史 雏形开始于2002年的Apache的Nutch,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 随后在2003年Google发表了一篇技术学术论文谷歌文件系统(GFS)。GFS也就是googl
阅读全文
浙公网安备 33010602011771号