druid - 随笔分类 - 老董

Imply.io单机安装

摘要：安装查看启动日志可见启动了如下服务数据导入与查询导入离线数据与查询数据导入与查询导入离线数据与查询 quickstart/wikipedia-2016-06-27-sampled.json文件包含了维基百科的一些日志数据（每行是一个JSON字符串） quickstart/wikipedi 阅读全文

posted @ 2018-06-12 09:22 老董阅读(1722) 评论(1) 推荐(0)

Druid.io系列（九）：数据摄入

摘要：1. 概述 Druid的数据摄入主要包括两大类： 1. 实时输入摄入：包括Pull,Push两种 - Pull:需要启动一个RealtimeNode节点，通过不同的Firehose摄取不同种类的数据源。 - Push:需要启动Tranquility或是Kafka索引服务。通过HTTP调用的方式进行数阅读全文

posted @ 2018-06-11 20:21 老董阅读(2911) 评论(0) 推荐(0)

Druid.io系列（八）：部署

摘要：介绍前面几个章节对Druid的整体架构做了简单的说明，本文主要描述如何部署Druid的环境 Imply提供了一套完整的部署方式，包括依赖库，Druid，图形化的数据展示页面，SQL查询组件等。本文将基于Imply套件进行说明单机部署依赖 Java 8 or better Node.js 4.5 阅读全文

posted @ 2018-06-11 20:02 老董阅读(1911) 评论(0) 推荐(0)

Druid.io系列（七）：架构剖析

摘要：1. 前言 Druid 的目标是提供一个能够在大数据集上做实时数据摄入与查询的平台，然而对于大多数系统而言，提供数据的快速摄入与提供快速查询是难以同时实现的两个指标。例如对于普通的RDBMS,如果想要获取更快的查询速度，就会因为创建索引而牺牲掉写入的速度，如果想要更快的写入速度，则索引的创建就会受到阅读全文

posted @ 2018-06-11 19:30 老董阅读(5189) 评论(0) 推荐(0)

Druid.io系列（六）：问题总结

摘要：原文地址： https://blog.csdn.net/njpjsoftdev/article/details/52956508 我们在生产环境中使用Druid也遇到了很多问题，通过阅读官网文档、源码以及社区提问解决或部分解决了很多问题，现将遇到的问题、解决方案以及调优经验总结如下：问题一：Had 阅读全文

posted @ 2018-06-11 17:34 老董阅读(3917) 评论(0) 推荐(0)

Druid.io系列（五）：查询过程

摘要：原文链接： https://blog.csdn.net/njpjsoftdev/article/details/52956194 Druid使用JSON over HTTP 作为底层的查询语言，不过强大的社区也为我们提供了多种查询方式，比如Python接口pydruid、R接口RDruid、Java 阅读全文

posted @ 2018-06-11 17:33 老董阅读(839) 评论(0) 推荐(0)

Druid.io系列（四）：索引过程分析

摘要：原文链接: https://blog.csdn.net/njpjsoftdev/article/details/52956083 Druid底层不保存原始数据，而是借鉴了Apache Lucene、Apache Solr以及ElasticSearch等检索引擎的基本做法，对数据按列建立索引，最终转化阅读全文

posted @ 2018-06-11 17:32 老董阅读(2818) 评论(0) 推荐(0)

Druid.io系列（三）： Druid集群节点

摘要：原文链接: https://blog.csdn.net/njpjsoftdev/article/details/52955937 1 Historical Node Historical Node的职责单一，就是负责加载Druid中非实时窗口内且满足加载规则的所有历史数据的Segment。每一个Hi 阅读全文

posted @ 2018-06-11 17:30 老董阅读(980) 评论(0) 推荐(0)

Druid.io系列（二）：基本概念与架构

摘要：原文链接: https://blog.csdn.net/njpjsoftdev/article/details/52955788 在介绍Druid架构之前，我们先结合有关OLAP的基本原理来理解Druid中的一些基本概念。 1 数据以图3.1为例，结合我们在第一章中介绍的OLAP基本概念，按列的类阅读全文

posted @ 2018-06-11 17:28 老董阅读(958) 评论(0) 推荐(0)

Druid.io系列（一）：简介

摘要：原文链接： https://blog.csdn.net/njpjsoftdev/article/details/52955676 Druid.io（以下简称Druid）是面向海量数据的、用于实时查询与分析的OLAP存储系统。Druid的四大关键特性总结如下：亚秒级的OLAP查询分析。Druid采用阅读全文

posted @ 2018-06-11 17:27 老董阅读(1484) 评论(0) 推荐(0)

lenmom

公告

随笔分类 - druid