摘要:Index Compression(压缩比vs解压效率)主要是对倒排索引(inverted index)中的倒排列表(postings list)进行编码压缩。 编码方法:1.D-gaps:对有序编号(如docid)进行差值(d-gaps)编码。(处理小数据需要小代码量,处理时间短)编码并没有定义存储数据的比特模式,所以他自身不节省任何空间。2.Elias-γ Code结合了一元编码和二进制编码。编码数字k需要计算两个值: 3. Elias-δCode通过改变kd的编码方式,将kd分解为Kdd使用一元编码,kdr用二进制编码, kr仍然用二进制编码4. Variable Byte Code..
阅读全文
posted @ 2011-08-30 10:25
浙公网安备 33010602011771号