摘要:
一、Pig基本介绍 1. 起源 MapReduce的一个缺点是开发周期太长。写mapper和reducer,对代码进行编译和打包,提交作业,获取结果,这整个过程非常耗时。事实上,正是由于YAHOO公司想让科研人员和工程师能够便捷地挖掘大规模数据集,才设计了Pig. 2. 基础 一种探索大规模数据集的 阅读全文
摘要:
一、基本原理 数据源--MapReduce--数据结果 temperature.txt -- JAR -- part-r-00000 二、实验过程 1. 数据源 气象数据具体的下载地址为 ftp://ftp3.ncdc.noaa.gov/pub/data/noaa/ ,该数据包括1900年到现在所有 阅读全文