摘要:
1 现代大规模高质量搜索引擎一般采用三段式工作流程: 搜集 --- 预处理 --- 服务 2 搜集:在具体搜集过程中,如果抓取一篇篇的网页,也可以有不同的考虑。最常见的一种是所谓的“爬取”:将Web上的网页集合看成是一个有向图,搜集过程从给定的起始URL集合S开始,沿着网页中的链接,按照先深,先宽,或者某种策略遍历,不停的从S中移除URL,下载相应的网页,解析出网页中的超链接URL,看是否已经被访问过,将未访问过的那些URL加入到集合S,继续抓取直到S为空。3 搜集:搜集到的网页应该是相对比较重要的,所以在不可能将web上的网页搜集完全的情况下,使用先宽搜索方式要比先深搜索得到的网页集合重要, 阅读全文
随笔档案-2011年05月
搜索引擎概要认识
2011-05-12 20:46 by Aga.J, 323 阅读, 收藏,
摘要:
1 搜索引擎是一种在Web上应用的软件系统,以一定的策略在Web上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。2 搜索引擎提供信息查询服务的时候,面对的只是查询词,但是每个用户关心的是和这个查询词相关的不同方面的信息,所以搜索引擎应该争取不要漏掉任何相关的信息,把用户最关系的信息排在搜索结果的列表最前。3 搜索引擎需要解决大规模并发的用户事件。4 搜索引擎实际上需要自己先对网络上的网页进行搜索爬取,存放到自己的数据库服务器中,当用户提交搜索请求时,搜索引擎从系统内部进行搜索,获取必要的信息,返回url列表,而用户这时候点击的url,访问的才是网页的原始出处。5 以w 阅读全文
【好文要转】 C#中的析构函数
2011-05-09 16:06 by Aga.J, 397 阅读, 收藏,
摘要:
文章出处:ミ咯咯①笑。 的 C#中的析构函数析构函数 析构函数(destructor) 与构造函数相反,当对象脱离其作用域时(例如对象所在的函数已调用完毕),系统自动执行析构函数。析构函数往往用来做“清理善后” 的工作(例如在建立对象时用new开辟了一片内存空间,应在退出前在析构函数中用delete释放)。以C++语言为例,析构函数名也应与类名相同,只是在函数名前面加一个波浪符~,例如~stud( ),以区别于构造函数。它不能带任何参数,也没有返回值(包括void类型)。只能有一个析构函数,不能重载。如果用户没有编写析构函数,编译系统会自动生成一个缺省的析构函数,它也不进行任何操作。所以许多简 阅读全文
浙公网安备 33010602011771号