2020年3月30日
摘要: Impala和Hive的关系 Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析,实现了Hive的SQL语义的子集,功能还在不断的完善中。 与Hive 阅读全文
posted @ 2020-03-30 13:56 duanxz 阅读(5427) 评论(0) 推荐(0)
摘要: 一、概述 1.什么是数据模型? 数据模型就是数据的组织和存储方法。主要关注的是从业务、数据存取和使用角度合理存储数据。 2.典型数据仓库建模方法论 ER模型 纬度模型(建模四步曲:确定业务流程->确定粒度->确定纬度->确定事实表) 二、阿里巴巴数据整合管理体系oneData 1.体系架构 核心内容 阅读全文
posted @ 2020-03-30 11:39 duanxz 阅读(3332) 评论(0) 推荐(0)