03 2017 档案
摘要:YDB介绍 什么是延云YDB 基于spark排序的一种更廉价的实现方案-附基于spark的性能测试 大索引技术大数据的未来 YDB技术原理 YDB技术原理 那些年我们在spark SQL上踩过的坑 YDB跟Solr Cloud、ElasticSearch区别 YDB安装部署 YDB依赖的硬件环境详解
阅读全文
摘要:排序可以说是很多日志系统的硬指标(如按照时间逆序排序),如果一个大数据系统不能进行排序,基本上是这个系统属于不可用状态,排序算得上是大数据系统的一个“刚需”,无论大数据采用的是hadoop,还是spark,还是impala,hive,总之排序是必不可少的,排序的性能测试也是必不可少的。 有着计算奥运
阅读全文
摘要:什么是延云YDB YDB全称延云YDB,是一个基于Hadoop分布式架构下的实时的、多维的、交互式的查询、统计、分析引擎,具有万亿数据规模下的秒级性能表现,并具备企业级的稳定可靠表现。 YDB是一个细粒度的索引,精确粒度的索引。数据即时导入,索引即时生成,通过索引高效定位到相关数据。YDB与Spar
阅读全文
摘要:排序可以说是很多日志系统的硬指标(如按照时间逆序排序),如果一个大数据系统不能进行排序,基本上是这个系统属于不可用状态,排序算得上是大数据系统的一个“刚需”,无论大数据采用的是hadoop,还是spark,还是impala,hive,总之排序是必不可少的,排序的性能测试也是必不可少的。 有着计算奥运
阅读全文
摘要:关于spark的性能,基于YDB的对比,做了一个测试,保留备用。 一、YDB与spark sql在排序上的性能对比测试 在排序上,YDB具有绝对优势,无论是全表,还是基于任意条件组合过滤,基本秒杀spark任何格式。 测试结果(时间单位为秒) 详细测试地址:http://blog.csdn.NET/
阅读全文
浙公网安备 33010602011771号