随笔分类 -  Hive

 
Hive的内表和外表以及分区表
摘要:1、 内表和外表的区别内表和外表之间是通过关键字EXTERNAL来区分。删除表时:内表:在删除时,既删除内表的元数据,也删除内表的数据外表:删除时,仅仅删除外表的元数据。CREATE [EXTERNAL] TABLE page_view(viewTime INT, userid BIGINT,pag... 阅读全文
posted @ 2015-11-04 17:16 ljy2013 阅读(1858) 评论(0) 推荐(0)
Hive的API的说明
摘要:之前通过命令行的界面可以操作Hive,可是在实际的生产环境中,往往都是需要写API的,因此对Hive的API简单的列举了一下。并对Hive进行了一个简单的封装。具体的封装可以参考github网站主页:https://github.com/ljy2015/HiveUtil 在这个过程中,其本质... 阅读全文
posted @ 2015-11-02 17:24 ljy2013 阅读(2127) 评论(0) 推荐(0)
hive的Query和Insert,Group by,Aggregations(聚合)操作
摘要:1、Query(1)分区查询在查询的过程中,采用那个分区来查询是通过系统自动的决定,但是必须是在分区列上基于where子查询。SELECT page_views.*FROM page_viewsWHERE page_views.date >='2008-03-01'AND page_views.da... 阅读全文
posted @ 2015-10-19 15:28 ljy2013 阅读(2086) 评论(0) 推荐(0)
hive的基本操作
摘要:1、创建表First, create a table with tab-delimited text file format:(1)CREATE TABLE u_data ( userid INT, movieid INT, rating INT, unixtime STRING)ROW F... 阅读全文
posted @ 2015-10-19 11:41 ljy2013 阅读(301) 评论(0) 推荐(0)