2018年12月27日

摘要: 一、背景 1、当进程在进行远程通信时,彼此可以发送各种类型的数据,无论是什么类型的数据都会以二进制序列的形式在网络上传送。 发送方需要把对象转化为字节序列才可在网络上传输,称为对象序列化; 接收方则需要把字节序列恢复为对象,称为对象的反序列化。 2、Hive的反序列化是对key/value反序列化成 阅读全文
posted @ 2018-12-27 15:00 happygril3 阅读(398) 评论(0) 推荐(0)
摘要: 一、背景 1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。 2、分区表指的是在创建表时指定的partition的分区空间。 3、如果需要创建有分区的表,需要在create表的时候调用可 阅读全文
posted @ 2018-12-27 14:08 happygril3 阅读(584) 评论(0) 推荐(0)

导航