随笔分类 - 022-Hadoop
摘要:读数据 import java.io.BufferedReader; import java.io.InputStreamReader; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSyst
阅读全文
摘要:03-HDFS-01-模块结构 hadoop的存储方式,有点像scci硬盘,坏一个节点无所谓。随时插拔增减。 1.0 版本里,计算和资源调度在一个模块里。 2.0版本里: 资源调度YARN,独立成一个模块。MapReduce是YARN支持的第一个计算框架,是批处理硬盘计算框架。除此之外,还支持批处理
阅读全文
摘要:02-Hadoop-01-简介 Java开发 1. 历史 hadoop从nutch而来,nutch又是从lucene而来。 lucene >nutch搜索引擎 >hadoop文本搜索库 2002年,nutch无法存储海量网页 2003.google.gfs论文 >2004.nutch.ndfs >h
阅读全文
浙公网安备 33010602011771号