随笔分类 -  大数据

Dorisdb(Starrock)介绍和比较
摘要: 阅读全文

posted @ 2021-11-04 17:38 李雷 阅读(1651) 评论(0) 推荐(0)

大数据技术分类
摘要: 阅读全文

posted @ 2021-11-04 17:08 李雷 阅读(94) 评论(0) 推荐(0)

常用OLAP引擎对比
摘要: 阅读全文

posted @ 2021-11-04 16:49 李雷 阅读(134) 评论(0) 推荐(0)

初步的kudu+impala vs dorisdb vs tidb
摘要:造成dorisdb性能比较差的原因在于采用了”聚合“方式创建排序键的表结构,采用其他的方式性能要好很多 阅读全文

posted @ 2021-11-02 12:49 李雷 阅读(1466) 评论(0) 推荐(0)

HDP、CDH、CDP升级
摘要:前言 Cloudera 在跟HortonWorks 合并后,便推出了新一代大数据平台 CDP,并正在逐步停止原有的大数据平台 CDH 和 HDP。 但具体到何时会彻底停止对 CDH 和 HDP 的维护,CDH/HDP 停止维护后现有用户该如何应对,以及 CDP 跟 CDH/HDP 的异同,或多或少都 阅读全文

posted @ 2021-10-30 12:49 李雷 阅读(1977) 评论(0) 推荐(0)

CDH和HDP对比
摘要:主要的不同点apache AmbariClouderaManager Express(免费版) 配置版本控制和历史记录 支持 不支持 二次开发 支持 不支持 集成 支持 no (不支持redis、kylin、es) 维护 依靠社区力量 cloudera做了一些定制开发,自行维护或打patch会离社区 阅读全文

posted @ 2021-10-30 12:34 李雷 阅读(1640) 评论(0) 推荐(1)

mapreduce、spark、tez区别
摘要:MapReduceMapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。 TezTez是Apache开源的支持DAG作业的计算框架,它直接源于MapReduce框架,核心思想是将Map和Reduce两个操作进一步拆分,即Map被拆分成Input、Processor、Sort、M 阅读全文

posted @ 2021-10-30 12:22 李雷 阅读(658) 评论(0) 推荐(0)

导航