摘要: 一、Flume架构 1.1 Hadoop业务开发流程 1.2 Flume概述 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 支持在日志系统中定制各类数据发送方,用于收集数据; 同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等) 阅读全文
posted @ 2022-06-24 15:30 呆滞的猪蹄 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 一、HBase索引案例(使用redis存储索引) 在这里是简单模拟将索引存到redis中,再通过先查询索引再将Hbase中的数据查询出来。 ​ 需要考虑的问题: ​ 1、建立redis的连接,建立Hbase的连接 2、如何创建索引,即创建索引的key和value的设计 3、如何通过将查到的索引,去查 阅读全文
posted @ 2022-06-23 23:15 呆滞的猪蹄 阅读(64) 评论(0) 推荐(0) 编辑
摘要: HBase 的基本 API,包括增、删、改、查等。 增、删都是相对简单的操作,与传统的 RDBMS 相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根据行键的范围来查询(Scan)。 HBase 不仅提供了这些简单的查询,而且提供了更加高级的过滤器(Filter)来查询。 过滤 阅读全文
posted @ 2022-06-23 22:46 呆滞的猪蹄 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 二级索引的本质就是建立各列值与行键之间的映射关系 Hbase的局限性: HBase本身只提供基于行键和全表扫描的查询,而行键索引单一,对于多维度的查询困难。 所以我们引进一个二级索引的概念 常见的二级索引: HBase的一级索引就是rowkey,我们只能通过rowkey进行检索。如果我们相对hbas 阅读全文
posted @ 2022-06-23 22:43 呆滞的猪蹄 阅读(1153) 评论(0) 推荐(0) 编辑
摘要: HBase的RowKey设计 HBase是三维有序存储的,通过rowkey(行键),column key(column family和qualifier)和TimeStamp(时间戳)这个三个维度可以对HBase中的数据进行快速定位。 HBase中rowkey可以唯一标识一行记录,在HBase查询的 阅读全文
posted @ 2022-06-23 22:42 呆滞的猪蹄 阅读(50) 评论(0) 推荐(0) 编辑
摘要: HBase与Hive的对比 hive: 数据仓库:Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。 用于数据分析、清洗:Hive适用于离线的数据分析和清洗,延迟较高。 基于HDFS、MapReduce:Hive存储的数据依旧在DataN 阅读全文
posted @ 2022-06-23 22:41 呆滞的猪蹄 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 一、HBase的读写流程 1.1 HBase读流程 Hbase读取数据的流程: 1)是由客户端发起读取数据的请求,首先会与zookeeper建立连接 2)从zookeeper中获取一个hbase:meta表位置信息,被哪一个regionserver所管理着 hbase:meta表:hbase的元数据 阅读全文
posted @ 2022-06-23 22:39 呆滞的猪蹄 阅读(2346) 评论(0) 推荐(0) 编辑
摘要: scan进阶使用 查看所有的命名空间 list_namespace 查看某个命名空间下的所有表 list_namespace_tables 'default' 修改命名空间,设置一个属性 alter_namespace 'bigdata17',{METHOD=>'set','author'=>'wy 阅读全文
posted @ 2022-06-23 22:37 呆滞的猪蹄 阅读(45) 评论(0) 推荐(0) 编辑
摘要: Region信息观察 创建表指定命名空间 在创建表的时候可以选择创建到bigdata17这个namespace中,如何实现呢? 使用这种格式即可:‘命名空间名称:表名’ 针对default这个命名空间,在使用的时候可以省略不写 create 'bigdata17:t1','info','level' 阅读全文
posted @ 2022-06-23 22:34 呆滞的猪蹄 阅读(403) 评论(0) 推荐(0) 编辑
摘要: 一、hbase shell 命名 描述 语法 help ‘命名名’ 查看命令的使用描述 help ‘命令名’ whoami 我是谁 whoami version 返回hbase版本信息 version status 返回hbase集群的状态信息 status table_help 查看如何操作表 t 阅读全文
posted @ 2022-06-23 22:27 呆滞的猪蹄 阅读(61) 评论(0) 推荐(0) 编辑