2006年9月14日
摘要: 首先写一个处理URLs重写的类,并且这个类必须继承IHttpHandler接口,以博客园的程序为例: public class UrlReWriteModule : System.Web.IHttpModule{ public void Init(HttpApplication context) { context.BeginRequest +=new EventHandl... 阅读全文
posted @ 2006-09-14 15:10 心悦 阅读(151) 评论(0) 推荐(0) 编辑
摘要: 据说通过HttpModules可以将类似于:http://www.infotouch.cn/detail.aspx?id=120 的URL地址重写为:http://www.infotouch.cn/detail/120.aspx 。这样最直接的好处就是可以让搜索引擎搜索到页面,因为搜索引擎对?之后的参数不太理睬。 今天尝试了一下,发现一个需要注意的问题,就是HttpModules只能对特定扩展名的... 阅读全文
posted @ 2006-09-14 15:09 心悦 阅读(142) 评论(0) 推荐(0) 编辑
摘要: using System;namespace Test{ class Class1 { /// /// 应用程序的主入口点。 /// [STAThread] static void Main(string[] args) { string [] arrs=new string[... 阅读全文
posted @ 2006-09-14 15:04 心悦 阅读(5109) 评论(2) 推荐(0) 编辑
摘要: 互联网在近10年的得到飞速发展,互联网正在逐渐深入人们的生活,改变人们的生活。互联网经济也经历了风风雨雨,从缓慢起步到急速膨胀,从泡沫破灭到逐步回暖;从“网络广告”到“拇指经济”,从“网络游戏”到“搜索力经济”。目前,搜索引擎成为最受人们关注的焦点之一,也成为亿万富翁的制造摇篮。越来越多的公司都希望在搜索引擎这座金矿中挖到筐金子,其中许多人会选择拥有自己的搜索引擎。国内著名搜索引擎公司百度(htt... 阅读全文
posted @ 2006-09-14 14:24 心悦 阅读(297) 评论(0) 推荐(0) 编辑
摘要: 对于网络蜘蛛技术和排序技术请参考作者其它文章[1][2],这里以Google搜索引擎为例主要介绍搜索引擎的数据索引和搜索过程。 数据的索引分为三个步骤:网页内容的提取、词的识别、标引库的建立。 互联网上大部分信息都是以HTML格式存在,对于索引来说,只处理文本信息。因此需要把网页中文本内容提取出来,过滤掉一些脚本标示符和一些无用的广告信 息,同时记录文本的版面格式信息[1]。词的识别是搜索引擎中... 阅读全文
posted @ 2006-09-14 14:23 心悦 阅读(377) 评论(0) 推荐(0) 编辑
摘要: 这里主要针对全文检索搜索引擎的系统架构进行说明,下文中提到的搜索引擎如果没有特殊说明也是指全文检索搜索引擎。搜索引擎的实现原理,可以看作四步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索→对搜索结果进行处理和排序。 从互联网上抓取网页. 利用能够从互联网上自动收集网页的网络蜘蛛程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集到服... 阅读全文
posted @ 2006-09-14 14:22 心悦 阅读(404) 评论(0) 推荐(0) 编辑
摘要: (1)引用QQ:http://www.freezg.com/weather 代码如下 private void GetWeather() { HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://weather.news.qq.com/inc/dc189.htm"); request.Method = ... 阅读全文
posted @ 2006-09-14 14:13 心悦 阅读(281) 评论(0) 推荐(0) 编辑