Sqoop初识

Posted on 2020-04-17 08:55  MissRong  阅读(72)  评论(0)    收藏  举报

大数据技术之Sqoop 

一、Sqoop简介

Apache Sqoop(TM)是一种旨在有效地在Apache Hadoop和诸如关系数据库等结构化数据存储之间传输大量数据的工具。

是Hadoop的一个第三方插件

Sqoop于2012年3月孵化出来,现在是一个顶级的Apache项目。

请注意,1.99.7与1.4.6不兼容,且特征功能不完整,它并不打算用于生产部署。

二、Sqoop原理

数据的导入导出

导入:关系型数据库到HDFS、HIVE、HBASE

导出:HDFS、HIVE导出MYSQL

将导入或导出命令翻译成mapreduce程序来实现。

在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3