会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
HarkLee
打酱油
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
13
14
15
16
17
18
19
20
21
···
36
下一页
2016年5月30日
kylin1.5新特性 new aggregation group
摘要: 终于啃完并理解了,我果然弱鸡。new aggregation group,是kylin 1.5的新特性;老版本中的agg是需要选中所有可能被使用的纬度字段,以供查询;但存在高纬度的查询需求,例如查询某订单编号编号的数据,这时应该仅仅做filter,而不需要为此做cube,但在老版本的agg中,是不允
阅读全文
posted @ 2016-05-30 17:19 HarkLee
阅读(1062)
评论(1)
推荐(1)
2016年5月27日
kylin学习笔记
摘要: 阅读官网,学到哪就写到哪 1、需要先建立Model 2、kylin需要配置事实表,纬度表;可以自定义join。 我的用法和官方建议的不同,我是直接在hive中将所有的取join成一个单表,再根据单表进行cude kylin。 因为我的join的同时有一些业务上的处理。 3、需要选择cude的纬度字段
阅读全文
posted @ 2016-05-27 15:50 HarkLee
阅读(1129)
评论(0)
推荐(0)
sqoop与mysql之间中文乱码
摘要: sudo -u hive sqoop export --connect "jdbc:mysql://192.168.22.201/LauncherDB?useUnicode=true&characterEncoding=utf-8" --username root --password xxxxx-
阅读全文
posted @ 2016-05-27 12:14 HarkLee
阅读(769)
评论(0)
推荐(0)
【转】史上最全“大数据”学习资源整理
摘要: http://mp.weixin.qq.com/s?__biz=MzA5MTc0NTMwNQ==&mid=2650713542&idx=1&sn=6fb304aa04be4bef4799036aeff157f5&scene=0#rd 史上最全“大数据”学习资源整理 2016-05-17 Hadoop
阅读全文
posted @ 2016-05-27 10:46 HarkLee
阅读(5922)
评论(0)
推荐(0)
【转】【技术博客】Spark性能优化指南——高级篇
摘要: http://mp.weixin.qq.com/s?__biz=MjM5NjQ5MTI5OA==&mid=2651745207&idx=1&sn=3d70d59cede236eb1cb4f7374387a235&scene=0#rd 【技术博客】Spark性能优化指南——高级篇 2016-05-13
阅读全文
posted @ 2016-05-27 10:46 HarkLee
阅读(753)
评论(0)
推荐(0)
【转】Spark性能优化指南——基础篇
摘要: http://mp.weixin.qq.com/s?__biz=MjM5NDMwNjMzNA==&mid=2651805828&idx=1&sn=2f413828d1fdc6a64bdbb25c51508dfc&scene=2&srcid=0519iChOETxAx0OeGoHnm7Xk&from=
阅读全文
posted @ 2016-05-27 10:45 HarkLee
阅读(20152)
评论(2)
推荐(0)
【干货收藏】统计分析/机器学习吐血整理最强指南
摘要: http://mp.weixin.qq.com/s?__biz=MzAxNzc3NDA3OA==&mid=2651304431&idx=1&sn=4e82688613ecc6ae7c0eabdd94c63e4d&scene=2&srcid=0522V4U6Pi5XVmh6bxAMDY02&from=
阅读全文
posted @ 2016-05-27 10:44 HarkLee
阅读(7245)
评论(1)
推荐(1)
【转】超强收藏必备!盘点互联网人必须知道的数据报告网站
摘要: http://mp.weixin.qq.com/s?__biz=MjM5NDQ4MTcwMA==&mid=2650653721&idx=1&sn=71011e7f90d7f17e62244213ce9e12d4&scene=0#rd 超强收藏必备!盘点互联网人必须知道的数据报告网站 2016-05-
阅读全文
posted @ 2016-05-27 10:42 HarkLee
阅读(658)
评论(0)
推荐(0)
【方案】去哪儿网徐磊:如何利用开源技术构建日处理130亿+的实时日志平台?
摘要: 转自:http://mp.weixin.qq.com/s?__biz=MzIzMzEzODYwOA==&mid=2665284466&idx=1&sn=2b06a529821734e36e26e642424f24fc&scene=2&srcid=0527p3qISp6dFqGg8iLIYgRF&fr
阅读全文
posted @ 2016-05-27 10:02 HarkLee
阅读(6462)
评论(0)
推荐(1)
2016年5月26日
博客推荐
摘要: spark sparkstreaming 架构,源代码分析 : http://www.cnblogs.com/zhouyf/
阅读全文
posted @ 2016-05-26 20:00 HarkLee
阅读(140)
评论(0)
推荐(0)
上一页
1
···
13
14
15
16
17
18
19
20
21
···
36
下一页
公告