Loading

摘要: # 1. Logstash ![](https://img2020.cnblogs.com/blog/1104875/202201/1104875-20220113233442796-1575555426.png) Logstash 是一个数据抽取工具,将数据从一个地方转移到另一个地方。如 hado 阅读全文
posted @ 2022-01-13 23:37 tree6x7 阅读(170) 评论(0) 推荐(0)
摘要: # 1. 分析数据 ## 1.1 What's analysis? - 倒排索引:索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为“倒排索引”。 ![](https://img2022.cnblogs.com/blog/ 阅读全文
posted @ 2022-01-13 23:34 tree6x7 阅读(568) 评论(0) 推荐(0)
摘要: 1. 数据写入原理 1.1 写入流程 在 ES 中,NRT(Near Real-Time)指的是其搜索和索引的实时性特性。尽管 ES 可以快速地将数据写入并使其可搜索,但它并不是严格的实时系统,而是接近实时(Near Real-Time),通常延迟在 1s 左右。这种延迟主要与其内部架构和数据处理机 阅读全文
posted @ 2022-01-13 23:30 tree6x7 阅读(173) 评论(0) 推荐(0)
摘要: 1. 中文分词 “分词器”主要应用在中文上,在 ES 中字符串类型有 keyword 和 text 两种。keyword 默认不进行分词,而 ES 本身自带的中文分词会把 text 中每一个汉字拆开称为独立的词,这根本没有词汇的概念,就是单纯把中文一个字一个字的分开。这两种都是不适用于生产环境。 实 阅读全文
posted @ 2022-01-13 23:26 tree6x7 阅读(200) 评论(0) 推荐(0)
摘要: # 1. HTTP 操作 ![](https://img2022.cnblogs.com/blog/1104875/202207/1104875-20220731220153633-576167263.png) ## 1.1 索引操作 ### a. 创建索引 在 Lucene 中,创建索引是需要定义 阅读全文
posted @ 2022-01-13 23:23 tree6x7 阅读(394) 评论(0) 推荐(0)
摘要: 1. 引入 1.1 什么是搜索? 比如说我们想找寻任何的信息的时候,就会上百度去搜索一下,比如说找一部自己喜欢的电影,或者说找一本喜欢的书,或者找一条感兴趣的新闻。这是提到搜索的第一印象,但要注意,百度 != 搜索。 互联网的搜索:电商网站,招聘网站,新闻网站,各种 app IT 系统的搜索:OA 阅读全文
posted @ 2022-01-13 23:15 tree6x7 阅读(100) 评论(0) 推荐(0)