导航

随笔分类 -  ElasticSearch

摘要:Elasticsearch有一个功能叫做 聚合(aggregations) ,它允许你在数据上生成复杂的分析统计。它很像SQL中的 GROUP BY 但是功能更强大。 Aggregations种类分为: Metrics, Metrics 是简单的对过滤出来的数据集进行avg,max等操作,是一个单一的数值。 Bucket, Bucket 你则可以理解为将过滤出来的数据集按条件分成... 阅读全文

posted @ 2016-03-23 15:03 蝈蝈俊 阅读(35139) 评论(2) 推荐(3) 编辑

摘要:query 和 filter 的区别请看: http://www.cnblogs.com/ghj1976/p/5292740.html Filter DSL term 过滤 term主要用于精确匹配哪些值,比如数字,日期,布尔值或 not_analyzed 的字符串(未经分析的文本数据类型): { "term": { "age": 26 }} { "term... 阅读全文

posted @ 2016-03-18 18:43 蝈蝈俊 阅读(180888) 评论(3) 推荐(16) 编辑

摘要:Elasticsearch支持很多查询方式,其中一种就是DSL,它是把请求写在JSON里面,然后进行相关的查询。 Query DSL 与 Filter DSL DSL查询语言中存在两种:查询DSL(query DSL)和过滤DSL(filter DSL)。 它们两个的区别如下图: query DSL 在查询上下文中,查询会回答这个问题——“这个文档匹不匹配这个查询,它的相... 阅读全文

posted @ 2016-03-18 16:45 蝈蝈俊 阅读(13763) 评论(1) 推荐(1) 编辑

摘要:Heka 的参数配置跟Elasticsearch的参数没有关系,Heka只负责按照配置发送数据,所以索引的优化主要在 Elaticsearch端来完成。 下面是Elasticsearch的一些相关概念和知识点: 一些概念 在Elasticsearch中,文档归属于一种类型(type),而这些类型存在于索引(index)中,我们可以画一些简单的对比图来类比传统关系型数据库: Relat... 阅读全文

posted @ 2016-02-01 07:35 蝈蝈俊 阅读(1069) 评论(0) 推荐(1) 编辑

摘要:重置Heka执行进度 heka的进度配置文件存在配置项 base_dir 设置的目录,只需要删除这个文件夹下面的内容,就可以完全重置heka的进度。 base_dir 配置项默认是在下面目录: ‘/var/cache/hekad’ 或‘c:\var\cache\hekad’ 参考:http://hekad.readthedocs.org/en/latest/getting_started.... 阅读全文

posted @ 2016-01-20 14:14 蝈蝈俊 阅读(1162) 评论(0) 推荐(0) 编辑

摘要:简介 Elasticsearch是一个基于Lucene的开源搜索引擎。Elasticsearch也使用Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性,从而让全文搜索变得简单。 Elasticsearch不仅仅是Lucene和全文搜索,我们还能这样去描述它: 分布式的实时文件存储,每个字段都被索... 阅读全文

posted @ 2016-01-12 18:35 蝈蝈俊 阅读(377) 评论(0) 推荐(0) 编辑

摘要:facets接口可以根据query返回统计数据,其中的 terms_stats 是分组统计,根据key的情况返回value的统计数据,类似group by的意思。 "terms_stats" : { "key_field" : "", "value_field" : "" } 例子:查询每个ip的请求执行时间 查询语句: 1: { 2: "... 阅读全文

posted @ 2014-02-14 14:36 蝈蝈俊 阅读(20755) 评论(1) 推荐(0) 编辑

摘要:ElasticSearch是基于lucene的开源搜索引擎,它的查询语法关键字跟lucene一样,如下: 分页:from/size 字段:fields 排序:sort 查询:query 过滤:filter 高亮:highlight 统计:facet 参考资料: http://blog.csdn.net/lgnlgn/article/d... 阅读全文

posted @ 2014-02-08 19:20 蝈蝈俊 阅读(8065) 评论(0) 推荐(0) 编辑