ES数据库高级(二)
高级操作:
es聚合,Aggregations等,分组相当于分成桶,计算,大小等操作
索引问题:
es倒排索引(反向索引):通过单词找到对应的倒排列表,根据倒排列表中的倒排项(文档ID,单词频率,位置,偏移(记录单词在文档的开始位置和结束位置))进而可以找到文档记录),倒排索引可以压缩,根据属性的值来查找记录,例如,一句话包含很多关键字,然后会有单词集合,同一单词下存放对应的id,然后在对符合条件的内容进行查找就可以找到对应的文档
ES切词的2种方式
1、非smart模式:IK分词输出所有分词,非smart模式 张三 | 三 | 说的 | 的确 | 的 | 确实 | 实在 | 在理
2、smart模式:IK分词器则会根据内在方法输出一个认为最合理的分词结果,这就涉及到了歧义判断,smart模式 张三 | 说的 | 确实 | 在理
