随笔分类 - Searcharoo搜索引擎
摘要:搜索引擎有两个主要步骤: 建立。即处理文件,导航内容并且建立目录。 查找。利用建立的目录进行查找,针对关键字进行查找。 要建立这样一个目录,有两种手段,一是二叉查找树,二是哈希表,searcharoo第一版为了保持简单,选择了哈希表。建议最好熟悉哈希表的建立过程,我也需要补补。 按原文,searcharoo的对象模型如下:一个目录对象包含许多 单词 对象,一个 单词 对象又包含许多 文件 对象。在学习的过程中,我发现,这个单词跟我们中文的单词是不一样的,searcharoo第一版是针对英文搜索,所以分词只需通过空格。如果想要对中文分词,也有不少工具。注:ctor是构造函数。File:成员就不.
阅读全文
摘要:作为一名新手,想学习自己写出搜索引擎,这其中难度比较大。所以,计划先学习搜索引擎的原理,从Searcharoo入手。Searcharoo作为一个轻量级的搜索引擎,从最简单的第一个版本渐增到复杂的第七个版本,涉及到搜索引擎的方方面面,非常适合初学者去学习研究。从下篇开始将从第一个版本开始学习Searcharoo,资料来源于http://www.searcharoo.net/ 。
阅读全文
摘要:http://www.searcharoo.net/SearcharooV1/
阅读全文

浙公网安备 33010602011771号