随笔档案「2017年3月」 - 开心延年

YDB资源汇总

摘要：YDB介绍什么是延云YDB 基于spark排序的一种更廉价的实现方案-附基于spark的性能测试大索引技术大数据的未来 YDB技术原理 YDB技术原理那些年我们在spark SQL上踩过的坑 YDB跟Solr Cloud、ElasticSearch区别 YDB安装部署 YDB依赖的硬件环境详解阅读全文

posted @ 2017-03-12 18:32 开心延年阅读(209) 评论(0) 推荐(0)

基于spark排序的一种更廉价的实现方案-附基于spark的性能测试

摘要：排序可以说是很多日志系统的硬指标（如按照时间逆序排序），如果一个大数据系统不能进行排序，基本上是这个系统属于不可用状态，排序算得上是大数据系统的一个“刚需”,无论大数据采用的是hadoop,还是spark，还是impala,hive，总之排序是必不可少的，排序的性能测试也是必不可少的。有着计算奥运阅读全文

posted @ 2017-03-12 15:12 开心延年阅读(740) 评论(0) 推荐(0)

YDB一种让SPARK性能提升千百倍的一种新方式

摘要：什么是延云YDB YDB全称延云YDB，是一个基于Hadoop分布式架构下的实时的、多维的、交互式的查询、统计、分析引擎，具有万亿数据规模下的秒级性能表现，并具备企业级的稳定可靠表现。 YDB是一个细粒度的索引，精确粒度的索引。数据即时导入，索引即时生成，通过索引高效定位到相关数据。YDB与Spar 阅读全文

posted @ 2017-03-12 14:58 开心延年阅读(2122) 评论(0) 推荐(0)

让Spark将硬件性能压榨到极限-大数据分析性能测试

摘要：排序可以说是很多日志系统的硬指标（如按照时间逆序排序），如果一个大数据系统不能进行排序，基本上是这个系统属于不可用状态，排序算得上是大数据系统的一个“刚需”,无论大数据采用的是hadoop,还是spark，还是impala,hive，总之排序是必不可少的，排序的性能测试也是必不可少的。有着计算奥运阅读全文

posted @ 2017-03-07 14:32 开心延年阅读(1050) 评论(0) 推荐(0)

基于spark SQL之上的检索与排序对比性能测试

摘要：关于spark的性能，基于YDB的对比，做了一个测试，保留备用。一、YDB与spark sql在排序上的性能对比测试在排序上，YDB具有绝对优势，无论是全表，还是基于任意条件组合过滤，基本秒杀spark任何格式。测试结果(时间单位为秒) 详细测试地址：http://blog.csdn.NET/ 阅读全文

posted @ 2017-03-06 19:23 开心延年阅读(444) 评论(0) 推荐(0)

03 2017 档案

公告