上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 21 下一页
摘要: 1.概述 上次给大家分享了关于 Kafka SQL 的实现思路,这次给大家分享如何实现 Kafka SQL。要实现 Kafka SQL,在上一篇《Kafka - SQL 引擎分享》中分享了其实现的思路,核心包含数据源的加载,以及 SQL 树的映射。今天笔者给大家分享相关实现的代码。 2.内容 这里, 阅读全文
posted @ 2016-05-09 09:46 哥不是小萝莉 阅读(4710) 评论(3) 推荐(2)
摘要: 1.概述 大多数情况下,我们使用 Kafka 只是作为消息处理。在有些情况下,我们需要多次读取 Kafka 集群中的数据。当然,我们可以通过调用 Kafka 的 API 来完成,但是针对不同的业务需求,我们需要去编写不同的接口,在经过编译,打包,发布等一系列流程。最后才能看到我们预想的结果。那么,我 阅读全文
posted @ 2016-04-14 09:33 哥不是小萝莉 阅读(4977) 评论(1) 推荐(5)
摘要: 1.概述 在 Kafka 中,官方对外提供了两种消费 API,一种是高等级消费 API,另一种是低等级的消费 API。在 《高级消费 API》一文中,介绍了其高级消费的 API 实现。今天给大家介绍另一种消费 API。 2.内容 在使用过 Kafka 的高级消费 API 后,我们知道它是一种高度抽象 阅读全文
posted @ 2016-03-04 10:08 哥不是小萝莉 阅读(4720) 评论(2) 推荐(4)
摘要: 1.概述 在调度 Hadoop 的相关作业时,有以下几种方式: 基于 Linux 系统级别的 Crontab。 Java 应用级别的 Quartz。 第三方的调度系统。 自行开发 Hadoop 应用调度系统。 对于前两种,使用 Crontab 和 Quartz 是基本可以满足业务需求,但有其弊端。在 阅读全文
posted @ 2016-02-15 18:30 哥不是小萝莉 阅读(19429) 评论(3) 推荐(2)
摘要: 1.概述 在编写 Flink,Spark,Hive 等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前,是件让人兴奋的时,如果能带上趋势功能就更好了。今天,给大家介绍这么一款工具。它就能满足上述要求,在使用了一段时间之后,这里给大家分享以下使用心得。2.How to do 首先,我们... 阅读全文
posted @ 2016-01-21 17:09 哥不是小萝莉 阅读(24388) 评论(0) 推荐(5)
摘要: 1.概述 Apache Kylin是一个开源的分布式分析引擎,提供SQL接口并且用于OLAP业务于Hadoop的大数据集上,该项目由eBay贡献于Apache。2.What is Kylin 在使用一种模型,我们得知道她是干什么的,那么首先来看看Kylin的特性,其内容如下所示:可扩展超快的OL... 阅读全文
posted @ 2016-01-04 16:11 哥不是小萝莉 阅读(3690) 评论(7) 推荐(3)
摘要: 1.Overview Ambari是Apache推出的一个集中管理Hadoop的集群的一个平台,可以快速帮助搭建Hadoop及相关以来组件的平台,管理集群方便。这篇博客记录Ambari的相关问题和注意事项。方便为初学者省去搭配各个社区版的烦恼。2.How to works 在Ambari的官方W... 阅读全文
posted @ 2015-12-21 14:47 哥不是小萝莉 阅读(5293) 评论(3) 推荐(3)
摘要: 1.概述 在《Hadoop-Drill深度剖析》一文当中,给大家介绍了Drill的相关内容,就实时查询来说,Drill基本能够满足要求,同时还可以做一个简单业务上的聚合,如果在使用Hive做一些简单的业务统计(不涉及多维度,比如CUBE,ROLLUP之类的函数),只是用一些基本的聚合函数或是JOI... 阅读全文
posted @ 2015-12-15 11:08 哥不是小萝莉 阅读(6721) 评论(2) 推荐(4)
摘要: 1.概述 在《Hadoop - 实时查询Drill》一文当中,笔者给大家介绍如何去处理实时查询这样的业务场景,也是简略的提了一下如何去实时查询HDFS,然起相关细节并未说明。今天给大家细说一下相关细节,其中包含:HDFS,Hive以及HBase等内容。2.数据源和文件格式 在使用Drill去做实... 阅读全文
posted @ 2015-11-28 14:20 哥不是小萝莉 阅读(4032) 评论(0) 推荐(3)
摘要: 1.概述 在现实业务当中,存在这样的业务场景,需要实时去查询HDFS上的相关存储数据,普通的查询(如:Hive查询),时延较高。那么,是否存在时延较小的查询组件。在业界目前较为成熟的有Cloudera的Impala,Apache的Drill,Hortonworks的Stinger。本篇博客主要为大... 阅读全文
posted @ 2015-11-24 16:12 哥不是小萝莉 阅读(6433) 评论(5) 推荐(5)
上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 21 下一页