• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
呢喃的歌声
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理
上一页 1 ··· 15 16 17 18 19 20 21 22 23 ··· 29 下一页

2016年8月19日

hbase(ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet)
摘要: 今天启动clouder manager集群时候hbase list出现 (ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet ERROR: Can't get maste 阅读全文
posted @ 2016-08-19 01:16 呢喃的歌声 阅读(1534) 评论(0) 推荐(0)
 
 

2016年8月18日

Hive 复习
摘要: hive分为CLI(command line)(用的比较多) JDBC/ODBC-ThriftServer hiveServer(hive -service hiveserver),JDBC访问,一个客户端连接数,需要建立pool池,内存损耗极大,容易内存溢出(数据量太大不用) web gui(基本 阅读全文
posted @ 2016-08-18 01:18 呢喃的歌声 阅读(251) 评论(0) 推荐(0)
 
 

2016年8月17日

CDH hive的安装
摘要: tar zxvf 解压包 配置环境变量 export HIVE_HOME=/usr/local/soft/hiveexport PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HIVE_HOME/bin source生效 y 阅读全文
posted @ 2016-08-17 18:24 呢喃的歌声 阅读(712) 评论(0) 推荐(0)
 
CDH hadoop的安装
摘要: 1 先拷贝tar包到目录底下(tar 包解压 tar zxvf) 2 : 1、使用课程提供的hadoop-2.5.0-cdh5.3.6.tar.gz,上传到虚拟机的/usr/local目录下。(http://archive.cloudera.com/cdh5/cdh/5/)2、将hadoop包进行解 阅读全文
posted @ 2016-08-17 17:19 呢喃的歌声 阅读(301) 评论(0) 推荐(0)
 
shell脚本处理大数据系列之(一)方法小结
摘要: 转自:http://longriver.me/?p=57 方法1: 单进程处理大规模的文件速度如(上million量级)比较慢,可以采用awk取模的方法,将文件分而治之,这样可以利用充分的利用多核CPU的优势 1 2 3 4 for((i=0;i<5;i++));do cat query_ctx.2 阅读全文
posted @ 2016-08-17 10:58 呢喃的歌声 阅读(2555) 评论(0) 推荐(0)
 
linux 命令查看CPU和内存信息
摘要: 几个cpu more /proc/cpuinfo |grep "physical id"|uniq|wc -l 每个cpu是几核(假设cpu配置相同) more /proc/cpuinfo |grep "physical id"|grep "0"|wc -l cat /proc/cpuinfo | 阅读全文
posted @ 2016-08-17 10:14 呢喃的歌声 阅读(1352) 评论(0) 推荐(0)
 
 

2016年8月16日

kafka的推和拉的问题
摘要: 之前学习过这一问题,但是面试又被问道了。再次记录下 推还是拉? Kafka最初考虑的问题是,customer应该从brokes拉取消息还是brokers将消息推送到consumer,也就是pull还push。在这方面,Kafka遵循了一种大部分消息系统共同的传统的设计:producer将消息推送到b 阅读全文
posted @ 2016-08-16 18:01 呢喃的歌声 阅读(1424) 评论(0) 推荐(0)
 
 

2016年8月10日

spark sql 访问hive数据时找不mysql的解决方法
摘要: 我尝试着在classpath中加n入mysql的驱动仍不行解决方法:在启动的时候加入参数--driver-class中加入mysql 驱动 [hadoop@master spark-1.0.1-bin-hadoop2]$ bin/spark-shell --driver-class-path lib 阅读全文
posted @ 2016-08-10 11:14 呢喃的歌声 阅读(336) 评论(0) 推荐(0)
 
 

2016年8月5日

spark-scheduled调度算法
摘要: 1.3源码是如此,后面新版本源码会尽可能的根据用户shell配置的参数进行分配 1.spareadOutApps 尽可能分配到多的机器上面execute和CPU core 2.非spareadoutapps 尽可能少的分配到少的机器上,机器尽可能多的容纳execute和CPU core 总结:所以用 阅读全文
posted @ 2016-08-05 15:30 呢喃的歌声 阅读(140) 评论(0) 推荐(0)
 
 

2016年8月4日

spark yarn-cluster 和 yarn-client提交的配置
摘要: 1. spark conf 目录下需要配置进去hadoop home 2.需要spark 提交的配置文件 加上‘-- master yarn-cluster/yarn-client’设置提交的模式 阅读全文
posted @ 2016-08-04 15:32 呢喃的歌声 阅读(472) 评论(0) 推荐(0)
 
 
上一页 1 ··· 15 16 17 18 19 20 21 22 23 ··· 29 下一页

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3