Ivan's world

search engine, distributed system, asp.net, c#

01 2008 档案

WEBUS2.0 In Action - 解析索引文件结构(2)
摘要: 通过前一篇文章,我们知道了WEBUS的索引数据都在一个虚拟的目录(IDirectory)中得以保存。本篇将继续前文,详细解析索引中的数据类型。
为了同时实现关键词搜索和范围搜索,WEBUS的索引采取了“主索引(Master Index)+序列(Sequence)”的方式进行组织...阅读全文

posted @ 2008-01-21 16:56 Ivan Zou 阅读(1457) | 评论 (3) 编辑

WEBUS2.0 In Action - 解析索引文件结构(1)
摘要: WEBUS的索引数据全部保存在一种抽象的目录结构中,它既支持实际物理目录,也支持以流(System.IO.Stream)作为数据载体的逻辑目录...物理目录, 逻辑目录, 逻辑流...阅读全文

posted @ 2008-01-15 15:06 Ivan Zou 阅读(1408) | 评论 (1) 编辑

WEBUS2.0 In Action - 开始搜索
摘要: 当索引建好之后,要利用WEBUS2.0实现基本搜索功能,至少需要用到如下几个类和接口:
Webus.Index.IIndexReader (接口)
Webus.Index.IndexManager (类,实现IIndexReader)...阅读全文

posted @ 2008-01-05 10:35 Ivan Zou 阅读(2092) | 评论 (9) 编辑

WEBUS2.0 In Action - 创建索引
摘要: WEBUS2.0只能够将一种Document数据类型(Webus.Index.Document类)添加到索引中,所有其他类型的数据(如txt、html、word、pdf等等)都需要预先转换成Document才能够对其编制索引...阅读全文

posted @ 2008-01-03 10:47 Ivan Zou 阅读(1533) | 评论 (1) 编辑

推荐《Lucene In Action》一书
摘要: Lucene In Action, 一本极好的搜索引擎开发指南(当然是基于Lucene的开发,如今WEBUS也基本适用)。全书两大部分,Part 1阐述Lucene的结构和应用方法,也涉及到一些原理的介绍;Part 2阐述Lucene的应用、扩展和相关信息。如果对搜索引擎和相关应用技术感兴趣,强烈建议研读一下这本书,一定会有收获的!英文版:下载地址中文版:电子工业出版社,¥49阅读全文

posted @ 2008-01-02 17:27 Ivan Zou 阅读(268) | 评论 (0) 编辑

继续我的代码,分享我的快乐 - WEBUS2.0 资源汇总
摘要:

WEBUS2.0 In Action(WEBUS使用指南)
1. 创建索引
2. 开始搜索
3. 解析索引文件结构(1)
4. 解析索引文件结构(2)
5. 索引操作指南(1)
...阅读全文

posted @ 2008-01-02 16:51 Ivan Zou 阅读(1706) | 评论 (5) 编辑

导航

统计信息

News