大数据技术之Sqoop
一、Sqoop简介
Apache Sqoop(TM)是一种旨在有效地在Apache Hadoop和诸如关系数据库等结构化数据存储之间传输大量数据的工具。
是Hadoop的一个第三方插件
Sqoop于2012年3月孵化出来,现在是一个顶级的Apache项目。
请注意,1.99.7与1.4.6不兼容,且特征功能不完整,它并不打算用于生产部署。
二、Sqoop原理
数据的导入导出
导入:关系型数据库到HDFS、HIVE、HBASE
导出:HDFS、HIVE导出MYSQL
将导入或导出命令翻译成mapreduce程序来实现。
在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。
浙公网安备 33010602011771号