2013年1月8日

pig中将两列合并为一列:concat

摘要: aggregate=congregate 在新任务中,需要统计两个属性组成的集合,对应有多少个unique 元组。 在pig中统计是很恶心的事,必须先group (详见http://blog.csdn.net/longshenlmj/article/details/8481932) 我想通过... 阅读全文

posted @ 2013-01-08 16:53 代码王子 阅读(218) 评论(0) 推荐(0)

pig中对元组不能直接使用聚集函数(如COUNT)

摘要: pig中想要使用统计等aggregate函数,必须先group,再进行。而如何设计group也就成了一个相对麻烦的过程,这给程序设计造成了不小的麻烦。 所以pig很强大,但其语法还是有些晦涩,存在很大进步空间。 pig和sql不同,在sql中,可以直接对当前表使用aggregate函数,如cou... 阅读全文

posted @ 2013-01-08 16:43 代码王子 阅读(121) 评论(0) 推荐(0)

导航