摘要: 数据仓库主要特点: 面向主题:从不同业务系统抽取同一主题数据 集成的:通过对独立异构的数据最终归纳到一个主题下需要一系列的转换(ETL) 非易失的:只能追加不能更改 时变的:随时间不断变化(存储一段时间的数据,定时删除过时的数据,添加新的数据) Hive利用hdfs存储数据,利用mapreduce查 阅读全文
posted @ 2020-01-13 17:10 lagjaflgjfl 阅读(139) 评论(0) 推荐(0)
摘要: -- 1. hive 建立一张表,跟已经存在的结构化的数据文件产生映射关系-- 映射成功后,就可以通过写sql来分析这个结构化的数据,避免了写mr程序的麻烦。 -- 2.数据库 》 默认与/usr/hive/warehouse 下的文件夹对应 -- 表 》 数据库文件夹下面的子文件夹 /usr/hi 阅读全文
posted @ 2020-01-13 16:19 lagjaflgjfl 阅读(166) 评论(0) 推荐(0)