摘要:
Kettle的安装及简单使用 一、kettle概述 1、什么是kettle Kettle是一款开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 2、Kettle工程存储方式 (1)以XML形式存储 (2)以资源库方式存储(数据库资源库 阅读全文
posted @ 2022-10-07 14:41
小明同学slm
阅读(326)
评论(0)
推荐(0)
摘要:
FlinkX的安装与简单使用 FlinkX概述 FlinkX是在是袋鼠云内部广泛使用的基于flink的分布式离线和实时的数据同步框架,实现了多种异构数据源之间高效的数据迁移。 不同的数据源头被抽象成不同的Reader插件,不同的数据目标被抽象成不同的Writer插件。理论上,FlinkX框架可以支持 阅读全文
posted @ 2022-10-07 14:39
小明同学slm
阅读(83)
评论(0)
推荐(0)
摘要:
DataX的安装及使用 Hive通过外部表与HBase表关联 hive建表语句: // 第一个字段通常命名为keyCREATE EXTERNAL TABLE hivehbasetable( key INT ,name STRING ,age INT ,gender STRING ,clazz STR 阅读全文
posted @ 2022-10-07 14:36
小明同学slm
阅读(231)
评论(0)
推荐(0)
摘要:
SQOOP安装及使用 SQOOP安装 1、上传并解压 tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /usr/local/soft/ 2、修改文件夹名字 mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha/ 阅读全文
posted @ 2022-10-07 14:34
小明同学slm
阅读(126)
评论(0)
推荐(0)
摘要:
分布式日志采集系统Flume学习 一、Flume架构 1.1 Hadoop业务开发流程 1.2 Flume概述 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 支持在日志系统中定制各类数据发送方,用于收集数据; 同时,Flume提供对数据进行简单处理,并写到各种数据接受方( 阅读全文
posted @ 2022-10-07 14:31
小明同学slm
阅读(664)
评论(0)
推荐(0)

浙公网安备 33010602011771号