摘要: 范式的含义: 可以理解为,数据表的表结构所符合的某种设计标准的级别。 第一范式,是对关系模型的基本要求,不满足第一范式的关系,不能称之为关系型数据库。符合第一范式的关系,每个属性都不可以再分割。(属性不可分割) 第二范式,首先满足第一范式,确保表中的每列都和主键相关(也就是说在一个数据库表中,一个表 阅读全文
posted @ 2020-03-25 16:12 hulifang 阅读(4867) 评论(0) 推荐(0)
摘要: 1)map join(默认是开启的) MapJoin是hive的一种优化操作,其适用于小表join大表的场景,由于表的操作是在Map端且在内存进行的,所以其不需要启动reduce任务也就不需要经过shuffle阶段,从而能在一定程度上节省资源提高Join效率。 2)分区,分桶 3)合理设置map个数 阅读全文
posted @ 2020-03-25 14:18 hulifang 阅读(182) 评论(0) 推荐(0)