摘要:
三种方式根据需要弄哈;增量的,我觉得实际业务中,除非没有update操作才适合使用JDBC这种增量方式,不然都是扯犊子,毕竟hdfs对随机写不是很友好。这是全量的,慢的很。没有sqoop快。 1、JDBC Query Consumer (单表全量) 配置: JDBC Query Consumer 配 阅读全文
posted @ 2022-05-13 16:52
Family_zp
阅读(119)
评论(0)
推荐(0)
摘要:
Streamsets 很好用,功能齐全,但是不开源了。Cloudera也是,很忧伤啊。 在接触Streamsets的时候,已经需要注册下载了,但是呢,注册不上。官方没有扼杀所有,可以自己编译。下载地址: https://codeload.github.com/designmind/datacolle 阅读全文
posted @ 2022-05-13 16:11
Family_zp
阅读(316)
评论(0)
推荐(0)
摘要:
不说环境了,都到了元数据管理,基本的需要的java、maven肯定是不可少的。 编译: 官网下载apache-atlas-2.2.0-sources.tar.gz解压 tar -zxvf apache-atlas-2.2.0-sources.tar.gz编译,进入目录 mvn clean -Dski 阅读全文
posted @ 2022-05-13 15:21
Family_zp
阅读(106)
评论(0)
推荐(1)

浙公网安备 33010602011771号