2006 年 9月 14 日随笔档案 - 心悦

2006年9月14日

摘要：首先写一个处理URLs重写的类，并且这个类必须继承IHttpHandler接口，以博客园的程序为例： public class UrlReWriteModule : System.Web.IHttpModule{ public void Init(HttpApplication context) { context.BeginRequest +=new EventHandl... 阅读全文

posted @ 2006-09-14 15:10 心悦阅读(155) 评论(0) 推荐(0)

采用HttpModules来重写URLs（原理篇）转

摘要：据说通过HttpModules可以将类似于：http://www.infotouch.cn/detail.aspx?id=120 的URL地址重写为：http://www.infotouch.cn/detail/120.aspx 。这样最直接的好处就是可以让搜索引擎搜索到页面，因为搜索引擎对？之后的参数不太理睬。今天尝试了一下，发现一个需要注意的问题，就是HttpModules只能对特定扩展名的... 阅读全文

posted @ 2006-09-14 15:09 心悦阅读(149) 评论(0) 推荐(0)

根据拼音首字母筛选人名

摘要： using System;namespace Test{ class Class1 { /// /// 应用程序的主入口点。 /// [STAThread] static void Main(string[] args) { string [] arrs=new string[... 阅读全文

posted @ 2006-09-14 15:04 心悦阅读(5524) 评论(2) 推荐(0)

中文搜索引擎技术揭密：系统架构（转）

摘要：互联网在近10年的得到飞速发展，互联网正在逐渐深入人们的生活，改变人们的生活。互联网经济也经历了风风雨雨，从缓慢起步到急速膨胀，从泡沫破灭到逐步回暖；从“网络广告”到“拇指经济”，从“网络游戏”到“搜索力经济”。目前，搜索引擎成为最受人们关注的焦点之一，也成为亿万富翁的制造摇篮。越来越多的公司都希望在搜索引擎这座金矿中挖到筐金子，其中许多人会选择拥有自己的搜索引擎。国内著名搜索引擎公司百度（htt... 阅读全文

posted @ 2006-09-14 14:24 心悦阅读(343) 评论(0) 推荐(0)

搜索引擎的索引和搜索（转）

摘要：对于网络蜘蛛技术和排序技术请参考作者其它文章[1][2]，这里以Google搜索引擎为例主要介绍搜索引擎的数据索引和搜索过程。数据的索引分为三个步骤：网页内容的提取、词的识别、标引库的建立。互联网上大部分信息都是以HTML格式存在，对于索引来说，只处理文本信息。因此需要把网页中文本内容提取出来，过滤掉一些脚本标示符和一些无用的广告信息，同时记录文本的版面格式信息[1]。词的识别是搜索引擎中... 阅读全文

posted @ 2006-09-14 14:23 心悦阅读(439) 评论(0) 推荐(0)

搜索引擎的系统架构（转）

摘要：这里主要针对全文检索搜索引擎的系统架构进行说明，下文中提到的搜索引擎如果没有特殊说明也是指全文检索搜索引擎。搜索引擎的实现原理，可以看作四步：从互联网上抓取网页→建立索引数据库→在索引数据库中搜索→对搜索结果进行处理和排序。从互联网上抓取网页. 利用能够从互联网上自动收集网页的网络蜘蛛程序，自动访问互联网，并沿着任何网页中的所有URL爬到其它网页，重复这过程，并把爬过的所有网页收集到服... 阅读全文

posted @ 2006-09-14 14:22 心悦阅读(425) 评论(0) 推荐(0)

用HttpWebRequest写的一个天气预报小偷（转）

摘要：（１）引用ＱＱ：http://www.freezg.com/weather 代码如下 private void GetWeather() { HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://weather.news.qq.com/inc/dc189.htm"); request.Method = ... 阅读全文

posted @ 2006-09-14 14:13 心悦阅读(287) 评论(0) 推荐(0)