摘要:
第1章 概述 1.1 什么是DataX DataX 是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。 1.2 DataX的设计 为了解决异构数据源同步 阅读全文
posted @ 2020-09-09 18:21
架构艺术
阅读(193)
评论(0)
推荐(0)
摘要:
MongoDB 5.1 什么是MongoDB MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。MongoDB 旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类 阅读全文
posted @ 2020-09-09 18:10
架构艺术
阅读(125)
评论(0)
推荐(0)
摘要:
Flume最重要的组件是Source、Channel和Sink,另外,Flume Agent还有一些使Flume更加灵活的组件,如拦截器,Channel选择器,Sink组和Sink选择器。本文将讨论一下拦截器的应用。 拦截器 拦截器(Interceptor)是简单的插入式组件,设置在Source和S 阅读全文
posted @ 2020-09-09 10:34
架构艺术
阅读(444)
评论(0)
推荐(0)
浙公网安备 33010602011771号