随笔分类 -  大数据-hive

摘要:1 什么是SerDe SerDe 是两个单词的拼写 serialized(序列化) 和 deserialized(反序列化)。 什么是序列化和反序列化呢? 当进程在进行远程通信时,彼此可以发送各种类型的数据,无论是什么类型的数据都会以 二进制序列的形式在网络上传送。发送方需要把对象转化为字节序列才可 阅读全文
posted @ 2021-04-22 20:13 七彩木兰 阅读(477) 评论(0) 推荐(0)
摘要:一、单条插入数据 insert into table_nameselect '01','测试','2019-12-16' 二、批量造数据 1、将要造数据的表复制相同的表,格式为text格式: create table table_name_test as select * from table_na 阅读全文
posted @ 2020-03-26 21:26 七彩木兰 阅读(2624) 评论(0) 推荐(0)
摘要:问题:hive中数字排序是按首个数字优先排序 SELECT xxx FROM table_name ORDER BY xxx desc 排序结果: 解决:转换成浮点格式后再排序 SELECT xxx,* FROM table_name ORDER BY cast(xxx as float) desc 阅读全文
posted @ 2020-03-25 14:31 七彩木兰 阅读(781) 评论(0) 推荐(0)
摘要:substr(col,1,7) 分组 例如 select substr(t.UPDATE_TIME,1,7) as months,sum(t.tot_modal) as sumsfrom test tgroup by substr(t.UPDATE_TIME,1,7) 阅读全文
posted @ 2019-12-11 21:16 七彩木兰 阅读(4893) 评论(0) 推荐(0)
摘要:1、在shell里面进入beeline用户 beeline -u 'jdbc:hive2://100.01.01.01:10001' -n <账号> -p '<密码>' 2、查看库/表 show databases/tables; 3、查看表结构 desc table_name; 4、创建表 CRE 阅读全文
posted @ 2019-11-22 19:26 七彩木兰 阅读(798) 评论(0) 推荐(0)