08 2011 档案

摘要:Index Compression(压缩比vs解压效率)主要是对倒排索引(inverted index)中的倒排列表(postings list)进行编码压缩。 编码方法:1.D-gaps:对有序编号(如docid)进行差值(d-gaps)编码。(处理小数据需要小代码量,处理时间短)编码并没有定义存储数据的比特模式,所以他自身不节省任何空间。2.Elias-γ Code结合了一元编码和二进制编码。编码数字k需要计算两个值: 3. Elias-δCode通过改变kd的编码方式,将kd分解为Kdd使用一元编码,kdr用二进制编码, kr仍然用二进制编码4. Variable Byte Code.. 阅读全文

posted @ 2011-08-30 10:25 weedge 阅读(1212) 评论(0) 推荐(0) |

摘要:看到一篇相关的好文章,引用下:http://www.cnblogs.com/leoo2sk/archive/2011/07/10/mysql-index.html。相当滴不错,备忘下。在这篇文章中http://blog.csdn.net/weege/article/details/6526512介绍了B-tree/B+tree/B*tree,并且介绍了B-tree的查找,插入,删除操作。现在重新认识下B-TREE(温故而知新嘛~,确实如此。自己在写代码中会体会到,B-tree的操作出现的条件相对其他树比较复杂,调试也是一个理通思路的过程。)B-tree又叫平衡多路查找树。一棵m阶的B-tree 阅读全文

posted @ 2011-08-29 22:37 weedge 阅读(1038) 评论(0) 推荐(0) |

摘要:在网上对于字符串处理的相关介绍很多,这也是各大公司常考的题型,主要是因为在信息处理中,字符串是最常见的结构,这样,字符串作为一种数据结构类型出现在越来越多的程序设计语言中,同时出现了相关的处理字符串的库;如<string.h>,MFC封装的string类CString,以及现在比较流行的BOOST库中的字符串处理算法等等。所以从基本的知识开始,逐步了解基本的字符串操作,也是自己最近对字符串知识了解的总结和备忘。在本文中通过系统介绍字符串存储结构;字符串处理函数;字符串模式匹配算法。相应的给出代码实现。字符串处理函数相关资源参考网站:(PS:相应的代码归其作者所有,使用请声明!)ht 阅读全文

posted @ 2011-08-11 23:10 weedge 阅读(214) 评论(0) 推荐(0) |

博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3