摘要: Kettle的安装及简单使用 一、kettle概述 1、什么是kettle Kettle是一款开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 2、Kettle工程存储方式 (1)以XML形式存储 (2)以资源库方式存储(数据库资源库 阅读全文
posted @ 2022-10-07 20:50 ~小小~ 阅读(48) 评论(0) 推荐(0) 编辑
摘要: FlinkX的安装与简单使用 FlinkX概述 FlinkX是在是袋鼠云内部广泛使用的基于flink的分布式离线和实时的数据同步框架,实现了多种异构数据源之间高效的数据迁移。 不同的数据源头被抽象成不同的Reader插件,不同的数据目标被抽象成不同的Writer插件。理论上,FlinkX框架可以支持 阅读全文
posted @ 2022-10-07 20:44 ~小小~ 阅读(99) 评论(0) 推荐(0) 编辑
摘要: SQOOP安装及使用 SQOOP安装 1、上传并解压 tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /usr/local/soft/ 2、修改文件夹名字 mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha/ 阅读全文
posted @ 2022-10-07 20:36 ~小小~ 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 分布式日志采集系统Flume学习 一、Flume架构 1.1 Hadoop业务开发流程 1.2 Flume概述 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 支持在日志系统中定制各类数据发送方,用于收集数据; 同时,Flume提供对数据进行简单处理,并写到各种数据接受方( 阅读全文
posted @ 2022-10-07 20:31 ~小小~ 阅读(258) 评论(0) 推荐(0) 编辑
摘要: HBase学习(五) 一、HBase索引案例(使用redis存储索引) 在这里是简单模拟将索引存到redis中,再通过先查询索引再将Hbase中的数据查询出来。 ​ 需要考虑的问题: ​ 1、建立redis的连接,建立Hbase的连接 2、如何创建索引,即创建索引的key和value的设计 3、如何 阅读全文
posted @ 2022-10-07 20:18 ~小小~ 阅读(42) 评论(0) 推荐(0) 编辑
摘要: HBase学习(四) 一、HBase的读写流程 画出架构 1.1 HBase读流程 Hbase读取数据的流程: 1)是由客户端发起读取数据的请求,首先会与zookeeper建立连接 2)从zookeeper中获取一个hbase:meta表位置信息,被哪一个regionserver所管理着 hbase 阅读全文
posted @ 2022-10-07 19:58 ~小小~ 阅读(52) 评论(0) 推荐(0) 编辑
摘要: Hbase学习(三) HBase 的基本 API,包括增、删、改、查等。 增、删都是相对简单的操作,与传统的 RDBMS 相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根据行键的范围来查询(Scan)。 HBase 不仅提供了这些简单的查询,而且提供了更加高级的过滤器(Fil 阅读全文
posted @ 2022-10-07 19:49 ~小小~ 阅读(73) 评论(0) 推荐(0) 编辑
摘要: HBase学习(二) 一、Hbase shell 1、Region信息观察 创建表指定命名空间 在创建表的时候可以选择创建到bigdata19这个namespace中,如何实现呢? 使用这种格式即可:‘命名空间名称:表名’ 针对default这个命名空间,在使用的时候可以省略不写 create 'b 阅读全文
posted @ 2022-10-07 19:44 ~小小~ 阅读(57) 评论(0) 推荐(0) 编辑
摘要: HBase学习(一) 一、了解HBase 官方文档:https://hbase.apache.org/book.html 1.1 HBase概述 HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,用于存储海量的结构化或者半结构化,非结构化的数据(底层是字节数组做存储的) HBase 阅读全文
posted @ 2022-10-07 19:32 ~小小~ 阅读(251) 评论(0) 推荐(0) 编辑
摘要: Hive学习(四) Hive优化 1.1 hive的随机抓取策略 理论上来说,Hive中的所有sql都需要进行mapreduce,但是hive的抓取策略帮我们 省略掉了这个过程,把切片split的过程提前帮我们做了。 set hive.fetch.task.conversion=none; (一旦进 阅读全文
posted @ 2022-10-07 19:19 ~小小~ 阅读(41) 评论(0) 推荐(0) 编辑