摘要: 介绍: Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、 postgresql等)间进行数据的传递。可以将关系型数据库(MySQL ,Oracle ,Postgres等)中的数据导入到HDFS中,也可以将HDFS的数据导进到关系型数据库 中。 导入全部数据: 阅读全文
posted @ 2021-07-21 17:08 wangheng1409 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 介绍: Flume由Cloudera公司开发,是一个分布式、高可靠、高可用的海量日志采集、聚 合、传输的系统。 简单的说,Flume是实时采集日志的数据采集引擎。 重要组件:Source、Channel、Sink Agent本质上是一个 JVM 进程,该JVM进程控制Event数据流从外部日志生产者 阅读全文
posted @ 2021-07-21 10:56 wangheng1409 阅读(898) 评论(0) 推荐(0) 编辑