随笔分类 -  hadoop&hive&spark

大数据方面的一些东西
摘要:使用hive时,我们偶尔会遇到这样的问题,当你将结果输出到屏幕时,查出的数据往往显示为null,但是当你将结果输出到文本时,却显示为空(即未填充),这是为什么呢? 在hive中有一种假NULL,它看起来和NULL一样,但是实际却不是NULL。 比如下面这样: [hdfs@dsdc04 ~]$ cat 阅读全文
posted @ 2015-10-20 12:06 努力的小叶子 阅读(2115) 评论(0) 推荐(0)
摘要:HQL原文来自:http://slaytanic.blog.51cto.com/2057708/782175/ Slaytanic老师关于Hadoop的介绍来自:http://www.cnblogs.com/shishanyuan/p/4629300.html 石山园老师,他的Hadoop博客写得很... 阅读全文
posted @ 2015-07-26 19:30 努力的小叶子 阅读(860) 评论(0) 推荐(0)
摘要:文件的删除和恢复 和Linux系统的回收站设计一样,HDFS会为每一个用户创建一个回收站目录:/user/用户名/.Trash/,每一个被用户通过Shell删除的文件/目录,在系统回收站中都一个周期,也就是当系统回收站中的文件/目录在一段时间之后没有被用户恢复的话,HDFS就会自动的把这个文件/... 阅读全文
posted @ 2015-07-26 18:28 努力的小叶子 阅读(16280) 评论(0) 推荐(0)
摘要:hive函数参考手册 原文见:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF http://www.cnblogs.com/end/archive/2012/06/18/2553682.html 1.内置运算符1 阅读全文
posted @ 2015-01-22 14:58 努力的小叶子 阅读(196) 评论(0) 推荐(0)