摘要:
Pig: DistinctDistinct主要是去掉重复的记录,是对条记录进行去重,而不是对单个某个schema。daily = load 'NYSE_daily' as (exchange:chararray, symbol:chararray);uniq = distinct daily它需要收... 阅读全文
posted @ 2014-08-08 20:29
琴&天
阅读(188)
评论(0)
推荐(0)
摘要:
Pig的数据类型能够分为两种:一种是scalar类型,包含单一的value,一种是complex类型,包含有其他的类型。对于scalar类型:int,long,float,double,chararray(取代了string),bytecharray.复杂点的类型:1、Map(我用python编写的... 阅读全文
posted @ 2014-08-08 12:52
琴&天
阅读(333)
评论(0)
推荐(0)
浙公网安备 33010602011771号