随笔分类 - tantivy
摘要:postings的存储, 读取, 缓存一个term的postings list 存储1: sort2: delta3: 每128个docID, 按block存储. block记录bits per value(该block最大值的bits, like fdx)4: skipper(for boolea
阅读全文
摘要:硬件概述:cpu:24,内存:20g,磁盘:10*2.7T。 写入性能:(不对ip进行添加geo信息)。 写入性能对比 速度 Commit耗时(秒) 500*1000条 Bulk耗时(秒) 1000条dns Bulk耗时(秒) 1000条tcpflow Bulk耗时(秒) 1000条weblog C
阅读全文
摘要:写入对比每个路径下都只能有一个IndexWriter负责写入,通过writer.lock实现。不同:lucene可以多个线程共享一个IndexWriter,每个线程负责写一个segment,从addDocument到index都用es bulk线程。详见:https://www.cnblogs.co
阅读全文

浙公网安备 33010602011771号