11 2017 档案

摘要:本文主要介绍spark join相关操作。 讲述spark连接相关的三个方法join,left-outer-join,right-outer-join,在这之前,我们用hiveSQL先跑出了结果以方便进行对比。 我们以实例来进行说明。我的实现步骤记录如下。 1、数据准备 2、HSQL描述 3、Spa 阅读全文
posted @ 2017-11-03 16:45 扎心了老铁 阅读(46476) 评论(1) 推荐(3)
摘要:在使用elasticsearch的时候,经常会遇到需要淘汰掉历史数据的场景。 为了方便数据淘汰,并使得数据管理更加灵活,我们经常会以时间为粒度建立索引,例如: 每个月建立一个索引:monthly-201709、monthly-201710、monthly-201711 每天建立一个索引:daily- 阅读全文
posted @ 2017-11-02 11:01 扎心了老铁 阅读(6606) 评论(0) 推荐(0)