摘要:Apache HiveHive 是基于Hadoop平台下的一个数据仓库工具,它能用于数据集成、ad-hoc queries、大数据分析. 它的本质就是将类似于熟悉的SQL的语句转换为MapReduce程序, 这种语句叫HiveQL.Apache HiveTM有以下特点:它提供了一个易用的ETL工具它提供多样数据格式的转换机制它能直接在Apache HDFSTM中存取数据,也可以对数据存储系统进行存取,比如Apache HBaseTM它就是通过查询自动的转换为了MR。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper
阅读全文
随笔分类 - Hadoop
大数据,hadoop,云平台相关随笔

浙公网安备 33010602011771号