摘要: aggregation分类 aggregations —— 聚合,提供了一种基于查询条件来对数据进行分桶、计算的方法。有点类似于 SQL 中的 group by 再加一些函数方法的操作。 聚合可以嵌套,由此可以组成复杂的操作(Bucketing聚合可以包含sub-aggregation)。 聚合整体 阅读全文
posted @ 2016-05-16 20:43 弋痕夕的残影 阅读(2414) 评论(0) 推荐(0)
摘要: 概述 在使用 ES 的时,我们不需要事先定义好映射设置就可以直接向索引中导入文档。ES 可以自动实现每个字段的类型检测,并进行 mapping 设置,这个过程就叫动态映射(dynamic mapping)。 动态映射可以通过以下设置来关闭。 动态映射的规则也可以自定义,有以下几种我们可以自定义规则的 阅读全文
posted @ 2016-05-16 10:59 弋痕夕的残影 阅读(2213) 评论(0) 推荐(0)
摘要: mapping type 映射设置一般发生在: 1. 增加新的 index 的时候,添加 mapping type,对 fields 的映射进行设置 2. 为 index 增加新的 mapping type,对 fields 的映射进行设置 3. 为已有 mapping type 增加新的 fiel 阅读全文
posted @ 2016-05-15 17:07 弋痕夕的残影 阅读(682) 评论(0) 推荐(0)
摘要: 文档标识相关元数据字段 _index 当执行多索引查询时,可能需要添加特定的一些与文档有关联的索引的子句。 _index 字段可以用在 term、terms 查询,聚合(aggregations)操作,脚本(script)操作以及用来排序(sort)。 GET index_1,index_2/_se 阅读全文
posted @ 2016-05-14 12:15 弋痕夕的残影 阅读(1109) 评论(0) 推荐(0)
摘要: 基本类型 1. 字符串 字符串类型被分为两种情况:full-text 和 keywords。 full-text 表示字段内容会被分析,而 keywords 表示字段值只能作为一个精确值查询。 参数: analyzer、boost、doc_values、fielddata、fields、ignore 阅读全文
posted @ 2016-05-12 19:52 弋痕夕的残影 阅读(822) 评论(0) 推荐(0)
摘要: 映射(mapping) 映射是定义一个文档以及其所包含的字段如何被存储和索引的方法。 例如,用映射来定义以下内容: 哪些 string 类型的 field 应当被当成当成 full-text 字段 哪些字段应该是数值类型、日期类型或者是地理位置信息 日期类型字段的格式是怎么样的 是否文档的所有字段都 阅读全文
posted @ 2016-05-12 16:36 弋痕夕的残影 阅读(2989) 评论(0) 推荐(0)
摘要: 概念解析 CURD 操作 CURD 操作都是针对具体的某个或某些文档的操作,每个文档的 routing 都是确认的,所以其所在分片也是可以事先确定的。该过程对应 ES 的 Document API。 新建(C): 指对某个文档进行索引操作的过程。 检索(R): 指从 ES 中获取某个或多个特定文档的 阅读全文
posted @ 2016-05-07 09:59 弋痕夕的残影 阅读(3184) 评论(0) 推荐(0)
摘要: 数组 1. 数组中的 full-text 字段将被 【analyzed】 2. 数组中【所有元素】的数据类型必须一致 3. 数组的数据类型,以其 【第一个元素】为准 映射 1. 数据类型会自动进行转化,比如 123 可以被转为 string ,但是 “test string” 没法转换为 long 阅读全文
posted @ 2016-05-06 19:11 弋痕夕的残影 阅读(2538) 评论(0) 推荐(0)
摘要: 搜索过程 图解: 主要 API: IndexSearcher: //所有搜索都通过 IndexSearcher 进行,他们将调用该类中重载的 search() 方法 Query: //封装某种查询类型的具体子类,Query 实例将会被传递给 IndexSearcher 的 search() 方法 Q 阅读全文
posted @ 2016-05-03 20:39 弋痕夕的残影 阅读(649) 评论(0) 推荐(0)
摘要: Lucene 数据建模 基本概念 文档(doc): 文档是 Lucene 索引和搜索的原子单元,文档是一个包含多个域的容器。 域(field): 域包含“真正的”被搜索的内容,每一个域都有一个标识名称,而“域值”则是实际被搜索的对象。 词元(term): 每个域的域值可能为一个复合字符串,通过分析器 阅读全文
posted @ 2016-05-01 17:25 弋痕夕的残影 阅读(489) 评论(0) 推荐(0)