09 2019 档案

摘要:期望 顺着上一篇文章《Hadoop学习之第一个MapReduce程序》中遗留的分片疑惑,探究TextInputFormat的分片逻辑。 第一步 上Apache官网下载实验所使用的Hadoop3.2.0版本源码,导入IntelliJ Idea中,不赘述了。下载链接:https://www.apache 阅读全文
posted @ 2019-09-23 17:06 行走的段子 阅读(372) 评论(0) 推荐(0)
摘要:期望 通过这个mapreduce程序了解mapreduce程序执行的流程,着重从程序解执行的打印信息中提炼出有用信息。 执行前 程序代码 程序代码基本上是《hadoop权威指南》上原封不动搬下来的,目的为求出某一年份中最高气温,相关代码如下: public class NcdcWeather { p 阅读全文
posted @ 2019-09-19 17:44 行走的段子 阅读(909) 评论(0) 推荐(0)
摘要:目的 记录学习hadoop过程中遇到的基础问题,无关大小、无关困扰时间长短。 问题一 全分布式环境中运行mapred程序,报异常:java.net.NoRouteToHostException: 没有到主机的路由 在全分布式环境中运行mapred程序,报异常:java.net.NoRouteToHo 阅读全文
posted @ 2019-09-14 17:49 行走的段子 阅读(400) 评论(0) 推荐(0)
摘要:期望目的 下载《Hadoop权威教程》里用到的NCDC天气数据,供后续在此数据基础上跑mapred程序。 操作过程 步骤一、编写简单的shell脚本,下载数据文件到本地文件系统 已知NCDC天气数据父目录地址为ftp://ftp.ncdc.noaa.gov/pub/data/noaa/,编写如下脚本 阅读全文
posted @ 2019-09-06 17:37 行走的段子 阅读(1666) 评论(0) 推荐(1)