随笔分类 - Pig
摘要:1.新建两个文件A.txt与B.txt, A.txt文件的内容如下: 0,1,2 1,3,4 B.txt文件的内容如下: 0,5,2 1,7,8 将这两个文件上传到目录/zwy/soft 2.定义关系a与b,代码如下 3.测试输出a与b的内容 4.UNION命令,将多个关系归并在一起 UNION运算
阅读全文
摘要:1.选取数据样本 在pig安装目录下有一个文件tutorial/data/excite small.log,其中的数据分为3列,中间用制表符分隔,第一列为用户ID,第二列为Unix时间戳,第三列为查询记录。 首先从该文件选取40条记录作为样本,另存为文件pig testdata.log,上传到目录/
阅读全文