pig中查询top k,返回每个hour和ad_network_id下最大两个记录(SUBSTRING,order,COUNT_STAR,limit)
摘要:
pig里面是有TOP函数,不知道为什么用不了。有时间要去看看pig源码了。 SET job.name 'top_k'; SET job.priority HIGH; --REGISTER piggybank.jar; REGISTER wizad-etl-udf-0.1.jar; --... 阅读全文
posted @ 2014-11-10 17:18 代码王子 阅读(153) 评论(0) 推荐(0)
浙公网安备 33010602011771号