摘要: 一、Pig基本介绍 1. 起源 MapReduce的一个缺点是开发周期太长。写mapper和reducer,对代码进行编译和打包,提交作业,获取结果,这整个过程非常耗时。事实上,正是由于YAHOO公司想让科研人员和工程师能够便捷地挖掘大规模数据集,才设计了Pig. 2. 基础 一种探索大规模数据集的 阅读全文
posted @ 2018-06-06 15:38 水共禾刀 阅读(645) 评论(0) 推荐(0) 编辑
摘要: 一、基本原理 数据源--MapReduce--数据结果 temperature.txt -- JAR -- part-r-00000 二、实验过程 1. 数据源 气象数据具体的下载地址为 ftp://ftp3.ncdc.noaa.gov/pub/data/noaa/ ,该数据包括1900年到现在所有 阅读全文
posted @ 2018-06-06 14:36 水共禾刀 阅读(323) 评论(0) 推荐(0) 编辑