随笔分类 -  Searcharoo搜索引擎

摘要:搜索引擎有两个主要步骤: 建立。即处理文件,导航内容并且建立目录。 查找。利用建立的目录进行查找,针对关键字进行查找。 要建立这样一个目录,有两种手段,一是二叉查找树,二是哈希表,searcharoo第一版为了保持简单,选择了哈希表。建议最好熟悉哈希表的建立过程,我也需要补补。 按原文,searcharoo的对象模型如下:一个目录对象包含许多 单词 对象,一个 单词 对象又包含许多 文件 对象。在学习的过程中,我发现,这个单词跟我们中文的单词是不一样的,searcharoo第一版是针对英文搜索,所以分词只需通过空格。如果想要对中文分词,也有不少工具。注:ctor是构造函数。File:成员就不. 阅读全文
posted @ 2011-08-18 15:39 苏先森1989 阅读(424) 评论(0) 推荐(0)
摘要:作为一名新手,想学习自己写出搜索引擎,这其中难度比较大。所以,计划先学习搜索引擎的原理,从Searcharoo入手。Searcharoo作为一个轻量级的搜索引擎,从最简单的第一个版本渐增到复杂的第七个版本,涉及到搜索引擎的方方面面,非常适合初学者去学习研究。从下篇开始将从第一个版本开始学习Searcharoo,资料来源于http://www.searcharoo.net/ 。 阅读全文
posted @ 2011-08-10 16:45 苏先森1989 阅读(426) 评论(0) 推荐(0)
摘要:http://www.searcharoo.net/SearcharooV1/ 阅读全文
posted @ 2011-08-03 17:45 苏先森1989 阅读(205) 评论(0) 推荐(0)