会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
HarkLee
打酱油
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
16
17
18
19
20
21
22
23
24
···
36
下一页
2015年12月25日
maven打的jars项目,log4j不会输出日志
摘要: 通过maven打完包,运行jars时,会输出警告log4j:WARN No appenders could be found for logger (com.dlht.DataCenterSYNC.opt.App).log4j:WARN Please initialize the log4j sys...
阅读全文
posted @ 2015-12-25 12:11 HarkLee
阅读(1679)
评论(0)
推荐(0)
2015年12月24日
关于sqoop与datax。 和sqoop to oracle插件OraOop
摘要: 之前我还在想了解下datax,是否有可能替换sqoop,但了解后发现,datax和sqoop的业务场景是不同的。前者适合异构数据库的同步,后者适合hdfs与rdbms互相之间的同步。针对sqoop的应用场景使用datax那么速度会有加倍的差距。主要原因在于datax是一个节点写数据,而sqoop...
阅读全文
posted @ 2015-12-24 15:49 HarkLee
阅读(632)
评论(0)
推荐(0)
2015年12月21日
hive中,向map类型插入数据时,需要str_to_map一下
摘要: 如题
阅读全文
posted @ 2015-12-21 19:50 HarkLee
阅读(1548)
评论(0)
推荐(0)
2015年12月17日
[hive小技巧]同一份数据多种处理
摘要: 其实就是from表时,可以插入到多个表。 sql语句的模板如下:from historyinsert overwrite sales select * where actino='purchased'inesrt overwrite credits select * where action = '...
阅读全文
posted @ 2015-12-17 17:14 HarkLee
阅读(498)
评论(0)
推荐(0)
[hive小技巧]使用limit查询变成抽样,而不是全盘扫描
摘要: 将set hive.limit.optimize.enable=true 时,limit限制数据时就不会全盘扫,而是根据限制的数量进行抽样。同时还有两个配置项需要注意:1、hive.limit.row.max.size 我理解这个是控制最大的抽样数量2、 hive.limit.optimize.l...
阅读全文
posted @ 2015-12-17 17:12 HarkLee
阅读(2348)
评论(0)
推荐(0)
[hive小技巧]增加hive并行度
摘要: 可以通过修改set hive.exec.parallel=true来修改并行度。如果job中并行执行的阶段增多,那么集群利用率会增加。
阅读全文
posted @ 2015-12-17 17:04 HarkLee
阅读(2000)
评论(0)
推荐(1)
2015年12月16日
运维排查问题的方法和脚本
摘要: 转自 :http://mp.weixin.qq.com/s?__biz=MzA5ODM5MDU3MA==&mid=401136434&idx=1&sn=774a4e53d95ff9e34fbfa57df44dbb8d&scene=2&srcid=12162ON7Ty466yoisUvGaKsD&fr...
阅读全文
posted @ 2015-12-16 10:23 HarkLee
阅读(573)
评论(0)
推荐(0)
2015年12月11日
【转】cloudera新增用户权限配置
摘要: 转自http://lookqlp.iteye.com/blog/2189119 。 配置起来较复杂,需要在有测试环境之后再进行配置测试。 之后是有上HUE的计划的,所以这个也是一定要做的。目标:给各个业务组提供不同用户及用户组,并有限制的访问hdfs路径,及hive数据库。前提:clouderac...
阅读全文
posted @ 2015-12-11 18:12 HarkLee
阅读(4324)
评论(0)
推荐(0)
HUE的时区问题
摘要: 转自 http://molisa.iteye.com/blog/1953390 我主要是根据这个说明调整的HUE的时区问题 在使用Cloudera Hue时遇到一问题: 1. 使用Sqoop导入功能时,由于配置错误,使得“保存运行”后Job并不能正常提交,且界面上没有相关提示: 使用Hue的Sqoo
阅读全文
posted @ 2015-12-11 17:47 HarkLee
阅读(4754)
评论(0)
推荐(0)
linux根分区扩容
摘要: Linux根分区扩容1.fdisk–l(红线部分为新添加的硬盘)2.磁盘格式化3.mkfs.ext3-Tlargefile/dev/sde(格式化上面的分区)4.vgdisplay查看当前卷组情况(红色内容表明没有可用的扩展空间)5.pvcreate/dev/sde创建pv6.vgextendVol...
阅读全文
posted @ 2015-12-11 10:45 HarkLee
阅读(12167)
评论(0)
推荐(0)
上一页
1
···
16
17
18
19
20
21
22
23
24
···
36
下一页
公告