打赏
上一页 1 2 3 4 5 6 7 8 9 ··· 22 下一页
摘要: 1、集群部署的基本流程 2、集群部署的基础环境准备 3、Storm集群部署 4、Storm集群的进程及日志熟悉 5、Storm集群的常用操作命令 6、Storm源码下载及目录熟悉 7、Storm 单词计数案列 1、集群部署的基本流程 集群部署的流程:下载安装包、解压安装包、修改配置文件、分发安装包、 阅读全文
posted @ 2018-07-30 10:10 QueryMarsBo 阅读(340) 评论(0) 推荐(0) 编辑
摘要: 主要目标: 1. 离线计算是什么? 2. 流式计算是什么? 3. 流式计算与离线计算的区别? 4. Storm是什么? 5. Storm与Hadoop的区别? 6. Storm的应用场景及行业案例 7. Storm的核心组件(重点) 8. Storm的编程模型(重点) 9. 流式计算的一般架构图(重 阅读全文
posted @ 2018-07-26 17:55 QueryMarsBo 阅读(1595) 评论(0) 推荐(0) 编辑
摘要: 7 HBase的MapReduce HBase中Table和Region的关系,有些类似HDFS中File和Block的关系。由于HBase提供了配套的与MapReduce进行交互的API如 TableInputFormat和TableOutputFormat,可以将HBase的数据表直接作为Had 阅读全文
posted @ 2018-07-25 09:17 QueryMarsBo 阅读(1252) 评论(0) 推荐(0) 编辑
摘要: 2 HBase体系结构 2.1 设计思路 HBase是一个分布式的数据库,使用Zookeeper管理集群,使用HDFS作为底层存储。在架构层面上由HMaster(Zookeeper选举产生的Leader) 和多个HRegionServer组成,基本架构如下图所示: 在HBase的概念中,HRegio 阅读全文
posted @ 2018-07-23 10:23 QueryMarsBo 阅读(289) 评论(0) 推荐(0) 编辑
摘要: Hbase API 操作开发需要连接Zookeeper进行节点的管理控制 1.配置 HBaseConfiguration: 包:org.apache.hadoop.hbase.HBaseConfiguration下的HBaseConfiguration 作用:通过此类可以对HBase进行配置 2.表 阅读全文
posted @ 2018-07-22 10:52 QueryMarsBo 阅读(208) 评论(0) 推荐(0) 编辑
摘要: Hbase提供了一个shell的终端给用户交互:#$HBASE_HOME/bin/hbase shell,执行quit命令可以退出命令行 2.使用Hbase Shelll 命令操作: 名称 命令表达式 创建表 create '表名', '列族名1','列族名2','列族名N' 例如:create ' 阅读全文
posted @ 2018-07-21 17:22 QueryMarsBo 阅读(286) 评论(0) 推荐(0) 编辑
摘要: 3.1.Hbase数据模型: 概念视图: 物理视图 Hbase数据在存储系统中是以列族来体现的[Column Family],任何时候可以随意的添加一列到已经存在的列族中 空的单元格在表中不做存储也不体现, 阅读全文
posted @ 2018-07-21 09:56 QueryMarsBo 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 1.HBase安装配置,使用独立zookeeper,shell测试 安装步骤:首先在Master(shizhan2)上安装:前提必须保证hadoop集群和zookeeper集群是可用的 1.上传:用工具将hbase安装包hbase-0.99.2-bin.tar.gz上传到:/data/softwar 阅读全文
posted @ 2018-07-20 09:42 QueryMarsBo 阅读(567) 评论(0) 推荐(0) 编辑
摘要: 1. Hbase简介 1.1. 什么是hbase(面向列) HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模 结构化存储集群。 HBASE的目标是存储并处理大型的数据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万 阅读全文
posted @ 2018-07-20 08:34 QueryMarsBo 阅读(245) 评论(0) 推荐(0) 编辑
摘要: 7 模块开发—统计分析 注:每一种统计指标都可以跟各维度表进行叉乘,从而得出各个维度的统计结果篇幅限制,叉乘的代码及注释信息详见项目 工程代码文件,为了在前端展示时速度更快,每一个指标都事先算出各维度结果存入mysql 1. PV统计 1.1 多维度统计PV总量 1. 时间维度 阅读全文
posted @ 2018-07-19 18:13 QueryMarsBo 阅读(179) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 22 下一页