摘要:
数据仓库主要特点: 面向主题:从不同业务系统抽取同一主题数据 集成的:通过对独立异构的数据最终归纳到一个主题下需要一系列的转换(ETL) 非易失的:只能追加不能更改 时变的:随时间不断变化(存储一段时间的数据,定时删除过时的数据,添加新的数据) Hive利用hdfs存储数据,利用mapreduce查 阅读全文
posted @ 2020-01-13 17:10
lagjaflgjfl
阅读(139)
评论(0)
推荐(0)
摘要:
-- 1. hive 建立一张表,跟已经存在的结构化的数据文件产生映射关系-- 映射成功后,就可以通过写sql来分析这个结构化的数据,避免了写mr程序的麻烦。 -- 2.数据库 》 默认与/usr/hive/warehouse 下的文件夹对应 -- 表 》 数据库文件夹下面的子文件夹 /usr/hi 阅读全文
posted @ 2020-01-13 16:19
lagjaflgjfl
阅读(166)
评论(0)
推荐(0)

浙公网安备 33010602011771号