摘要:
1、把需要的处理的文件先得传输到hdfs上去 2、把mapreducer程序打成jar包传输到linux中 3、在yarn上跑jar包 hadoop jar jar包名 main方法的入口名称 一、导入pom文件 <repositories> <repository> <id>cloudera</i 阅读全文
摘要:
一、基本概念 一句话概括:HDFS是hadoop分布式文件系统,作用是存储大数据文件,是hadoop领域最基础的部分。 二、HDFS的重要特性 一群屌丝机组成高富帅 1、主从架构 namenode作为master负责管理元数据,datanode作为从节点存储block块数据 主从:通常是一主多从,主 阅读全文