随笔分类 - hdfs
摘要:注:在工程pom.xml 所在目录,cmd中运行 mvn package ,打包可能会有两个jar,名字较长的是包含所有依赖的重量级的jar,可以在linux中使用 java -cp 命令来跑。名字较短的jar,只包含了我们自己创建的类的依赖的轻量级jar,需要hadoop,所以在linux中需要使
阅读全文
摘要:HDFS 概述 基于2.7.3 HDFS 优点: 1、高容错性 数据自动保存多个副本,默认是三个副本 副本丢失后,会自动恢复 2、适合批处理 移动计算而非移动数据,批处理的时候,数据量很大,移动数据是不合适的,好的方式是分布式的移动计算 数据位置暴露给计算框架,数据被切分为 block list,b
阅读全文

浙公网安备 33010602011771号