17-索引原理之倒排索引





我们录入数据时,会分成索引区和元数据区。
元数据区就是记录的我们录入的一条条的数据。
索引区:
如果字段不分词,就记录它的id和出现次数
如果字段分词,就记录分词的id、出现次数、文章长度 。并用这个出现次数和文章长度计算相关度
比如我们这里录入的三条数据,假如我们对description进行搜索,这个字段是分词的,并且”很“在三个数据中都出现了。并且都出现了一次,但是文章长度:2=3<1,所以对于2号和3号来说,相关度更高,即得分一样,故查询的时候,
2号和3号排在1号前面。

浙公网安备 33010602011771号