天戈朱 - 博客园

kylin(二): Calcite

摘要： Apache Calcite是面向Hadoop新的查询引擎，它提供了标准的SQL语言、多种查询优化和连接各种数据源的能力，除此之外，Calcite还提供了OLAP和流处理的查询引擎。Calcite之前的名称叫做optiq，optiq起初在Hive项目中，为Hive提供基于成本模型的优化。2014年5 阅读全文

posted @ 2016-12-06 20:32 天戈朱阅读(1960) 评论(0) 推荐(0)

kylin(一): 原理架构

摘要：由eBay开源的一个大数据OLAP框架，2014年11月加入了Apache，项目名字也改成了“Apache Kylin”，Apache Kylin是唯一来自中国的Apache顶级开源项目，定位于在Hadoop平台之上实现传统数据仓库，商业智能的能力，提供交互式的，多维分析能力，并提供在传统数据仓库技阅读全文

posted @ 2016-12-06 20:31 天戈朱阅读(21714) 评论(0) 推荐(1)

ES(二):Kibana

摘要： Kibana是一个基于浏览器页面的Elasticsearch前端展示工具。Kibana全部使用HTML语言和Javascript编写的，查询语法是基于Lucene的查询语法。允许布尔运算符、通配符和字段筛选。注意关键字要大写全文搜索在搜索栏输入login，会返回所有字段值中包含login的文档阅读全文

posted @ 2016-11-29 08:42 天戈朱阅读(4567) 评论(0) 推荐(0)

ES(一): 架构及原理

摘要： Elasticsearch 是一个兼有搜索引擎和NoSQL数据库功能的开源系统，基于Java/Lucene构建，可以用于全文搜索，结构化搜索以及近实时分析。可以说Lucene是当今最先进，最高效的全功能开源搜索引擎框架。说明： Lucene：只是一个框架，要充分利用它的功能，需要使用JAVA，并且阅读全文

posted @ 2016-11-29 08:41 天戈朱阅读(38889) 评论(1) 推荐(1)

大数据架构--log

该文被密码保护。阅读全文

posted @ 2016-11-25 09:16 天戈朱阅读(2) 评论(0) 推荐(0)

Durid(二): 数据集及存储

摘要： druid有三种类型的数据结构: timestamp列,维度列,指标列. 时间撮和指标在底层都是int数组或long数组. 指标值是int或long,而时间撮为long. Segment文件的内部结构可以看做是列式存储. 每一列的数据都是以不同的数据结果存储. 通过列式存储,查询时只查询需要的列可以阅读全文

posted @ 2016-11-25 09:16 天戈朱阅读(2230) 评论(1) 推荐(0)

Durid(一): 原理架构

摘要： Durid是在2013年底开源出来的，当前最新版本0.9.2, 主要解决的是对实时数据以及较近时间的历史数据的多维查询提供高并发(多用户)，低延时，高可靠性的问题。对比Druid与其他解决方案，Kylin对数据按照分区每天构建前一天的cube数据提供给用户查询，用户查询的是历史数据。而Druid不断阅读全文

posted @ 2016-11-22 05:35 天戈朱阅读(8683) 评论(1) 推荐(4)

大数据架构--JD

该文被密码保护。阅读全文

posted @ 2016-11-16 18:12 天戈朱阅读(5) 评论(0) 推荐(0)

大数据架构--BD

该文被密码保护。阅读全文

posted @ 2016-11-16 18:01 天戈朱阅读(3) 评论(0) 推荐(0)

大数据架构--XC

该文被密码保护。阅读全文

posted @ 2016-11-16 18:00 天戈朱阅读(3) 评论(0) 推荐(0)

公告