海纳百川 有容乃大(http://www.brtech.com.cn)

海纳百川,有容乃大(http://www.brtech.com.cn)

  :: 首页 :: :: 联系 :: 订阅 :: 管理 ::

随笔分类 -  搜索引擎

摘要:什么是网络蜘蛛 网络蜘蛛是一种能自动到网上查找信息的一种程序,该程序具有高度的自动性,只要告诉他一个网站,他就可以从这个网站开始依次通过该网站的链接自动抓取链接内容以及网址,然后就顺着这些链接一直抓下去。 网络蜘蛛可以方便的实现从网络中抓取信息并且保存到当地数据库。 智能型的网络蜘蛛甚至可以抓取您指定的信息并自动过滤掉不相关的信息,替代重复的人工操作。 网络蜘蛛运行时必须设置种子网站,设置的... 阅读全文
posted @ 2006-03-26 06:18 阿昆 阅读(1562) 评论(2) 推荐(0)

摘要:互联网发展的今天,一方面离不开其开放、共享的特性带给人们的全新体验,另一方面也离不开数以亿计的为其提供各类丰富内容的网络节点。互联网被普及前,人们查阅资料第一想到的便是拥有大量书籍资料的图书馆,到了今天你怎么想?或许今天的很多人都会选择一种更方便、快捷、全面、准确的方式——互联网。你可以坐在家里轻点几下鼠标就查到想要的各类信息,这在互联网没有被普及之前,还都仅是一个梦而已,但如今这一切已成为了可能... 阅读全文
posted @ 2006-03-26 06:05 阿昆 阅读(799) 评论(0) 推荐(0)

摘要:搜索引擎的实现原理,可以看作四步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索→对搜索结果进行处理和排序。 1、从互联网上抓取网页 利用能够从互联网上自动收集网页的“网络蜘蛛”自动访问互联网,从互联网上抓取网页,把网页送入“网页数据库”,从网页中“提取URL”,把URL送入“URL数据库”,“蜘蛛控制”得到网页的URL,控制“网络蜘蛛”抓取其它网页,反复循环直到把所有... 阅读全文
posted @ 2006-03-26 04:52 阿昆 阅读(588) 评论(0) 推荐(0)

摘要:案背景: 网站站内搜索引擎逐渐称为网站不可缺少的组成部分,同时也成为网站地位的象征。然而,随着网络的发展,组织和组织之间的关系越来越紧密,简单的站内搜索引擎已经不能满足网站的需求。特别是对于政府机构网站、行业门户网站等,除了在网站内部有自己的搜索引擎以外,还需要对于下属机构或兄弟机构的网站实现统一搜索。 因此,门户搜索成为了一个重要的组成部分。目前门户搜索主要需要满足以下功能: 1. 可以... 阅读全文
posted @ 2006-03-26 03:10 阿昆 阅读(883) 评论(0) 推荐(0)