随笔分类 -  DataWarehouse

上一页 1 2

Mesa: GeoReplicated, Near RealTime, Scalable Data Warehousing
摘要:Mesa的定义并没有反映出他的特点,因为分布式,副本,高可用,他都是依赖google的其他基础设施完成的 他最大的特点是,和传统数仓比,可以做到near real-time的返回聚合的查询结果 算入实时数仓的范围,做到数据一致性,高吞吐的写入,并提供较好的查询性能 所以Mesa的核心是Storage 阅读全文

posted @ 2019-12-12 14:30 fxjwind 阅读(404) 评论(0) 推荐(0)

Presto: SQL on Everything
摘要:Presto是FB开源出来的实时分析引擎,可以federated的从多种数据源去读取数据,做联合查询,支持实时Interactive BI或bath ETL的需求 从其问题域来看,基本是和spark是重合的,那么两者区别是什么? https://stackoverflow.com/questions 阅读全文

posted @ 2019-12-11 14:13 fxjwind 阅读(1258) 评论(0) 推荐(0)

kudu
摘要:Kudu White Paper http://www.cloudera.com/documentation/betas/kudu/0-5-0/topics/kudu_resources.html http://getkudu.io/overview.html Kudu is a new stora 阅读全文

posted @ 2016-04-26 11:35 fxjwind 阅读(2573) 评论(0) 推荐(1)

上一页 1 2