摘要:1. select sname,score, case when score>=20 and score<30 then 20 when score>=30 and score<40 then 30 when score<=40 and score<50 then 40 else 50 end as
阅读全文
摘要:1.有多少个不同的省? select count(distinct province) from kg_fk_city 2 2. 每个城市的数目 select city,count(city) from kg_fk_city group by city changpin 3 chaoyang 6 h
阅读全文
摘要:1.时间戳 秒数时间戳--10位 hive只支持10位的时间戳 毫秒时间戳--13位 时间-->时间戳(13位),乘以 1000 13位时间戳-->日期(除以1000) (1)时间戳(10位)-》日期:from_unixtime select from_unixtime(1441565203,'yy
阅读全文
摘要:1. 全局排序 order by 对输入做全局排序,因此只有一个reducer。 select ymd,symbol,price_close from stocks oreder by symbol DESC select ymd,symbol,2*price_close as salary fro
阅读全文
摘要:一、背景 1、当进程在进行远程通信时,彼此可以发送各种类型的数据,无论是什么类型的数据都会以二进制序列的形式在网络上传送。 发送方需要把对象转化为字节序列才可在网络上传输,称为对象序列化; 接收方则需要把字节序列恢复为对象,称为对象的反序列化。 2、Hive的反序列化是对key/value反序列化成
阅读全文
摘要:一、背景 1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。 2、分区表指的是在创建表时指定的partition的分区空间。 3、如果需要创建有分区的表,需要在create表的时候调用可
阅读全文