随笔分类 - hadoop
learning journal
摘要:查看上面某一个文件的情况 解决方法 参考 http://centoshowtos.org/hadoop/fix-corrupt-blocks-on-hdfs/ http://stackoverflow.com/questions/19205057/how-to-fix-corrupt-hadoop-
阅读全文
摘要:一、参数含义 dfs.replication:设置数据块应该被复制的份数; dfs.replication.min:所规定的数据块副本的最小份数; dfs.replication.max:所规定的数据块副本的最大份数; dfs.safemode.threshold.pct:指定应有多少比例的数据块满足最小副本数要求。 (1)当小于这个比例, 那就将系统切换成安全模式,对数据块进行复制; (...
阅读全文
摘要:导入数据最快的方式,可以略过WAL直接生产底层HFile文件 (环境:centos6.5、Hadoop2.6.0、HBase0.98.9) 1.SHELL方式 1.1 ImportTsv直接导入 命令:bin/hbase org.apache.hadoop.hbase.mapreduce.Impor
阅读全文
摘要:1.HA HA即为High Availability,用于解决NameNode单点故障问题,该特性通过热备的方式为主NameNode提供一个备用者,一旦主NameNode出现故障,可以迅速切换至备NameNode,从而实现不间断对外提供服务。 在一个典型的HDFSHA场景中,通常由两个NameNod
阅读全文
摘要:1.停止所有MR任务 2.检查HDFS 3.重启HDFS,重复第2步,检查HDFS 4.备份namenode数据 在本地磁盘备份重要的数据 5.停止HDFS 6.重新安装新版本hadoop,备份原来的配置文件,修改新版本的配置文件7.升级HDFS 8.监控升级 9.使用第2步中的命令,检查升级过后的
阅读全文
摘要:关于hadoop和hive、hbase的整合就不说了,这里就是在hadoop2.2.0的环境下整合hbase和hive 因为hive0.12不支持hadoop2,所以还要替换一些hadoop的jar包,但是从0.13开始就方便多了 环境:centos6.6-x64、jdk1.7、hadoop2.2.
阅读全文

浙公网安备 33010602011771号