2010年12月14日

摘要: 接http://www.cnblogs.com/twelfthing/articles/1905310.html4. 性能 官网上说到xapian的性能,用到了very well 。The short answer is “very well” – a previous version of the software powered BrightStation’s Webtop search engine, which offered a search over around 500 million web pages (around 1.5 terabytes of database fil 阅读全文
posted @ 2010-12-14 11:42 twelfthing 阅读(2341) 评论(0) 推荐(0) 编辑
 
摘要: 给这篇文章去了一个很潮的名字。充分的说明了这个过程是一个痛并快乐这的过程,xapian是老外的东西,中文资料少的可怜,很多东西都是自己慢慢摸索的。于是就想这写点动总结一下使用的心得。废话少说,言规正传。(一下涉及到代码部分全是用python)1.xapian表《《利用xapian构建自己的搜索引擎》》里已经讲的很明白,下面是copy下来的。lposting list table保存了被每一个term索引的document,实际上保存的应该是document在database中的Id,此Id是唯一的。lrecord table保存了每一个document所关联的data,data不能通过quer 阅读全文
posted @ 2010-12-14 10:59 twelfthing 阅读(3306) 评论(0) 推荐(0) 编辑