| | | | |

2016年8月19日

hbase(ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet)

摘要：今天启动clouder manager集群时候hbase list出现（ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet ERROR: Can't get maste 阅读全文

posted @ 2016-08-19 01:16 呢喃的歌声阅读(1536) 评论(0) 推荐(0)

2016年8月18日

Hive 复习

摘要： hive分为CLI（command line）（用的比较多） JDBC/ODBC-ThriftServer hiveServer（hive -service hiveserver），JDBC访问，一个客户端连接数,需要建立pool池,内存损耗极大,容易内存溢出（数据量太大不用） web gui（基本阅读全文

posted @ 2016-08-18 01:18 呢喃的歌声阅读(252) 评论(0) 推荐(0)

2016年8月17日

CDH hive的安装

摘要： tar zxvf 解压包配置环境变量 export HIVE_HOME=/usr/local/soft/hiveexport PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HIVE_HOME/bin source生效 y 阅读全文

posted @ 2016-08-17 18:24 呢喃的歌声阅读(712) 评论(0) 推荐(0)

CDH hadoop的安装

摘要： 1 先拷贝tar包到目录底下（tar 包解压 tar zxvf） 2 ： 1、使用课程提供的hadoop-2.5.0-cdh5.3.6.tar.gz，上传到虚拟机的/usr/local目录下。（http://archive.cloudera.com/cdh5/cdh/5/）2、将hadoop包进行解阅读全文

posted @ 2016-08-17 17:19 呢喃的歌声阅读(302) 评论(0) 推荐(0)

shell脚本处理大数据系列之(一)方法小结

摘要：转自：http://longriver.me/?p=57 方法1：单进程处理大规模的文件速度如（上million量级）比较慢，可以采用awk取模的方法，将文件分而治之，这样可以利用充分的利用多核CPU的优势 1 2 3 4 for((i=0;i<5;i++));do cat query_ctx.2 阅读全文

posted @ 2016-08-17 10:58 呢喃的歌声阅读(2557) 评论(0) 推荐(0)

linux 命令查看CPU和内存信息

posted @ 2016-08-17 10:14 呢喃的歌声阅读(1353) 评论(0) 推荐(0)

2016年8月16日

kafka的推和拉的问题

摘要：之前学习过这一问题,但是面试又被问道了。再次记录下推还是拉？ Kafka最初考虑的问题是，customer应该从brokes拉取消息还是brokers将消息推送到consumer，也就是pull还push。在这方面，Kafka遵循了一种大部分消息系统共同的传统的设计：producer将消息推送到b 阅读全文

posted @ 2016-08-16 18:01 呢喃的歌声阅读(1424) 评论(0) 推荐(0)

2016年8月10日

spark sql 访问hive数据时找不mysql的解决方法

摘要：我尝试着在classpath中加n入mysql的驱动仍不行解决方法：在启动的时候加入参数--driver-class中加入mysql 驱动 [hadoop@master spark-1.0.1-bin-hadoop2]$ bin/spark-shell --driver-class-path lib 阅读全文

posted @ 2016-08-10 11:14 呢喃的歌声阅读(336) 评论(0) 推荐(0)

2016年8月5日

spark-scheduled调度算法

摘要： 1.3源码是如此,后面新版本源码会尽可能的根据用户shell配置的参数进行分配 1.spareadOutApps 尽可能分配到多的机器上面execute和CPU core 2.非spareadoutapps 尽可能少的分配到少的机器上,机器尽可能多的容纳execute和CPU core 总结:所以用阅读全文

posted @ 2016-08-05 15:30 呢喃的歌声阅读(141) 评论(0) 推荐(0)

2016年8月4日

spark yarn-cluster 和 yarn-client提交的配置

摘要： 1. spark conf 目录下需要配置进去hadoop home 2.需要spark 提交的配置文件加上‘-- master yarn-cluster/yarn-client’设置提交的模式阅读全文

posted @ 2016-08-04 15:32 呢喃的歌声阅读(473) 评论(0) 推荐(0)