采用HttpModules来重写URLs

据说通过HttpModules可以将类似于:

    http://www.infotouch.cn/detail.aspx?id=120

    的URL地址重写为:

    http://www.infotouch.cn/detail/120.aspx 

    这样最直接的好处就是可以让搜索引擎搜索到页面,因为搜索引擎对?之后的参数不太理睬。

    今天尝试了一下,发现一个需要注意的问题,就是HttpModules只能对特定扩展名的URL进行重写(注:只能对“映射”-“应用程序扩展”中指定交给Asp.Net处理的扩展名文件进行处理),从Google找了些英文资料,发现这种情况是由IIS处理请求的机理决定的。

    IIS对于没有扩展名的URL处理请求的机理:

    如果请求的路径(path)有扩展名,IIS首先查找是否已设定了对应的应用程序扩展,有则将控制权交给该应用程序:

    所以对于 http://www.infotouch.cn/detail.aspx?id=120 这样的情况很容易处理,只要处理为 http://www.infotouch.cn/detail/120.aspx 即可。因为IIS根据*.aspx的扩展名将控制权交给了Asp.Net,进而转给了HttpModules。

    如果请求的路径(path)没有扩展名,例如:http://www.infotouch.cn/detail 这样的路径。IIS首先检查该虚拟路径是否对应到一个本地目录,如果具有对应的本地目录,再查找该目录下是否具有缺省文件,如果找到,就重定向为该缺省文件的路径。否则,IIS报告一个Http404-文件未找到错误。
首先写一个处理URLs重写的类,并且这个类必须继承IHttpHandler接口,以博客园的程序为例:

    public class UrlReWriteModule : System.Web.IHttpModule
    {
    public void Init(HttpApplication context)

    {
    context.BeginRequest +=new EventHandler(context_BeginRequest);
    }
    public void Dispose()

    {
    }
    }

    UrlReWriteModule类就是处理URLs重写的类,继承IHttpHandler接口,实现该接口的两个方法,Init和Dispose。在Init方法里注册自己定义的方法,如上例所示:

    content.BeginRequest +=new EventHandler(content_BeginRequest);

    BeginRequest是一个事件,在收到新的Http请求时触发,content_BeginRequest就是触发时处理的方法。另外说明一点,HttpModules能注册的方法还有很多,如:EndRequest、Error、Disposed、 PreSendRequestContent等等。

    在content_BeginRequest方法中具体处理URLs重写的细节,比如,将 http://www.cnblogs.com/rrooyy/archive/2004/10/24/56041.html 重写为 http://www.cnblogs.com/archive.aspx?user=rrooyy&id=56041
    (注:我没有仔细看DuDu的程序,这里只是举例而已)。然后将重新生成的Url用HttpContext.RewritePath()方法重写即可,如下:

    private void context_BeginRequest(object sender, EventArgs e)

    {
    HttpContext context  = ((HttpApplication)sender).Context;
    // 获取旧的Url
    string url = context.Request.Path.ToLower();
    // 重新生成新的Url
    string newUrl = ...; // 具体过程略
    // 重写Url
    context.RewritePath(newUrl);
    }

    提醒:newUrl的格式不是http://www.infotouch.com/user/archive.aspx,而是从当前应用程序根目录算起的绝对路径,如:user\archive.aspx,这一点请特别注意。

    最后要web.config中注册重写URLs的类,格式如下:

    <HTTPMODULES>
    <ADD type="classname,assemblyname" name="modulename"/>
    <REMOVE name="modulename"/>
    <CLEAR />
    </HTTPMODULES>

    采用<ADD>标签可以注册一个类;<REMOVE>可以移除某个类,如果某个子目录不希望继承父目录的某个Http Module注册,就需要使用这个标签;<CLEAR />可以移除所有的Http Module注册。
-------***********************************************************************************************---------------------
                                                   再转一篇文章
-------***********************************************************************************************---------------------
1.

有关于URL的重写,本文也只是拿来主意。相继有MS的组件“URLRewriter”和在Global.asax里的“Application_BeginRequest()”编码方式,以及IIS里的ISAPI设置。
娜列下来,实现方法也都很简单。
 
方法一:MS组件
这里也不用详解了,相关请看:
用法很简单,只需要把组件URLRewriter.dll拷到应用程序的bin目录下,然后在web.config下加入如下代码:
<configuration></configuration>中加入:
     <configSections>
          <sectionname="RewriterConfig"type="URLRewriter.Config.RewriterConfigSerializerSectionHandler, URLRewriter"/>
     </configSections>
    
     <RewriterConfig>
          <Rules>
              <RewriterRule>
                   <LookFor>~/(\d{4})/(\d{2})/Default\.aspx</LookFor>
                   <SendTo>~/Default.aspx?ID=$1</SendTo>
              </RewriterRule>
          </Rules>
     </RewriterConfig>

然后在<system.web></system.web>中加入:

<httpHandlers>
   <addverb="*"path="*.aspx"
        type="URLRewriter.RewriterFactoryHandler, URLRewriter"/>
</httpHandlers>
 
最后在地址栏上键入:http://localhost/Test/2004/12/News.aspx
效果出来了。
上面的<LookFor>~/(\d{4})/(\d{2})/News\.aspx</LookFor>这句这正则表达式URL,即被重写的URL,而<SendTo>~/Default.aspx?ID=$1</SendTo>这一句为原始URL地址。其中的$1为第一个正则表达式值(上面例子为:2004),以此类推,第二个即为$2 
 
方法二:Application_BeginRequest()
在应用程序中新建一个XML文件,文件内容为:文件名ReWriter.config
<?xmlversion="1.0"encoding="utf-8"?>
<ReWriterUrls>
     <rule>
          <old>(.*)/News/(\d{4})/Default\.aspx</old>
          <new>http://www.cnblogs.com/Default.aspx?id=$2&amp;type=$3</new>
     </rule>
</ReWriterUrls>
在Global.asax文件中的Application_BeginRequest(Object sender, EventArgs e)加入代码:
              try
              {
                   string path=Server.MapPath("~/ReWriter.config");
                   XPathDocument myXPathDocument = new XPathDocument(path);
                   XPathNavigator myXPathNavigator = myXPathDocument.CreateNavigator();
                   XPathNodeIterator myXPathNodeIterator = myXPathNavigator.Select ("//rule");
                   System.Text.RegularExpressions.Regex oReg;
                   string ReWriteUrl;
                   while (myXPathNodeIterator.MoveNext())
                   {
                        //oReg=new Regex(oNode.SelectSingleNode("url/text()").Value);
                        XPathNavigator nav2 = myXPathNodeIterator.Current.Clone();
                       string oldString="",newString="";
                        XPathNodeIterator it2 = nav2.Select("old");
                        while(it2.MoveNext())
                       {
                            oldString = it2.Current.Value;
                            break;
                       }
                       it2 = nav2.Select("new");
                        while(it2.MoveNext())
                       {
                            newString = it2.Current.Value;
                            break;
                       }
                        if(oldString != "" && newString != "")
                       {
                            oReg = new System.Text.RegularExpressions.Regex(oldString);
                            if(oReg.IsMatch(Request.Url.ToString()))
                            {
                                 ReWriteUrl = oReg.Replace(Request.Url.ToString(),newString);
                                 HttpContext.Current.RewritePath(ReWriteUrl);
                                 break;
                            }
                       }
                   }
              }
              catch
              {
              }
 
最后在地址栏上键入:http://localhost/Test/News/2004/Default.aspx
效果出来了。

 

2

Asp.net 用url重写(URLReWriter)实现任意二级域名

好久没有写技术文章,如果大家看不明白,就多看几篇,汗,或者,在文章的后面回复(这是最有效的办法),我会尽力帮助大家解答疑惑.

来找这篇文章的,应该都知道什么叫二级域名吧,废话就不说了.但是讨论前,先要明白一个思想问题.
很多朋友一直考虑不清(我前几天也一直搞不明白)的问题是,我键入一个地址后,怎么这个url就被重写了?
第一步:在浏览器键入了一个地址,比如http://love.kerry.com,点回车后,都发生了什么?
为了把问题简单化,我来这样解释:
第二步:首先,键入的地址被解析,最终来到了一台web服务器.交给IIS处理.在.net的世界中,IIS会把这样的请求再交给一个web处理器 处理,最后,该 web处理器 把处理的结果返回给浏览器,显示给用户看.
请不用忽略这样一个问题,第二步的所有事情都是在服务器端做的.在这些事情进行的时候,用户端的浏览器上面的地址不会改变.即使最后 web处理器 把处理结果返回来的时候,上面的地址也不会改变.
一开始键入的url,只是起一个敲门的作用,门敲完了,作用就算结束了,只有你的眼睛可以看到那个地址,浏览器,服务器等都不知道这个地址.
然后要明白的问题是,所谓url重写,也只是web开发人员知道的内幕情况,用户根本不知道发生了什么,他认为自己键入的地址就是应该出来屏幕上显示的结果.也就是说,我们在幕后控制要显示的内容.
接下来要考虑的是,怎么样控制显示的内容?
从上面说的过程,很明显要在 web处理器 的工作这一步动手脚.

一个最简单的考虑是,用户敲入了一个简单的不带任何参数地址, http://love.kerry.com然后我们把这个地址改成一个符合程序需要的带参数的地址, http://kerry.com?lover=notus,最后处理之.
所谓的url重写,就是在这一步.
用.net的术语来说,我们需要给应用程序注册一个httpmodule,用来处理特定的url
注册httpmodule,在web.config,
处理url,在我们提供的httpmodule程序中

大体相当于这样的一段程序

//用我们的httpmodule程序截获原始url
String OriginalUrl=” http://love.kerry.com”;
//处理原始url,得到最后需要的url,值为http://kerry.com?lover=notus
String FinalUrl=Rewrite(OriginalUrl);
// context重新将url在内部发送给IIS处理
context.RewritePath(FinalUrl);

接下来,我们来实现url重写.
第一步:确定要对哪些url执行重写,即制定重写规则
第二步:编写httpmodule处理程序
第三步:将编写的httpmodule整合入web程序,开始工作.

上面就是url重写的基本知识,而用url重写实现二级域名,过程一样.因为无论是二级域名还是三级域名,都是一个url地址.只要我们截获这个url地址,就可以在处理的时候动手脚.

这些工作挺麻烦,但是网络上已经有高人给我们写了这样的程序,参看下面的文章:

http://www.microsoft.com/china/msdn/library/webservices/asp.net/URLRewriting.mspx

http://www.cnblogs.com/jzywh/archive/2005/09/29/246650.html

http://www.cnblogs.com/jzywh/archive/2006/02/20/334004.html

文章结束了.

在实施过程中会碰到一些问题,大多是因为看上面的文章不仔细产生的,但是说实话,那么长的文章要看完也不容易.下面我来记录一些重要的问题.其中最后的两个问题,用具体的代码展示了如何处理重写的目标url以达到我们的要求

为什么非要用泛解析?
看了好多朋友的回复,我想现在可能有这样的误解,即,这篇关于url重写的文章只是给大家介绍一些处理方法.至于泛解析不泛解析,并不重要.
如果你不需要实现任意二级域名,那就用不着去实现泛解析,直接把你需要的二级域名定死,然后在url重写里处理好了!
 再退一步,如果连二级域名都不用实现,仅仅是对一个固定域名下的url进行重写,那都不需要修改msdn的那个urlrewriter,直接拿来用就可以实现了简单的url重写. zyw对这个项目进行的修改,只是为了取到全部的url进行更大限度的控制.而如我们所见,一开始msdn的那个urlrewriter并不关心域名的问题
我一开始给文章起这样的题目,是因为最近我项目里用到了,写文档的时候顺便就把这个文章写了



微软的URLRewriter是什么?这个项目在哪里下载的?
这个是在msdn上一篇介绍URLRewriter的文章中提供的示例程序,可以在这里下载到
http://www.microsoft.com/china/msdn/library/webservices/asp.net/URLRewriting.mspx


怎么使用这些代码?麻烦吗?
肯定的说,不麻烦,要做的事情有:
下载代码到你的机器上.
安装后,把URLRewriter这个项目添加到你自己的工程中
按照上面给的地址里的方法,修改代码
配置web.config,开始使用.


什么是httpmodule?

简单理解,就是一块处理http请求的程序
更详细的理解,请查阅sdk文档.


怎么样实现泛解析?

首先,在域名服务商那里添加一个*.kerry.com的二级域名,指向你的服务器ip
然后,在IIS里建立一个站点,这个站点的主机头留空,一般端口是80. 这个站点就是整个服务器端口80的默认网站.
给这个站点添加一个通配符应用程序映射(IIS站点属性 ->主目录 ->  配置),这个映射的目的是要asp.net ISAPI接管任何没有在IIS里明确的二级域名站点.


随便输入二级域名的时候,发生了什么?
当IIS检测到传入的url是一个二级域名的时候,它会先检查IIS上有没有注册了这个二级域名的站点,如果有,就转入到这个站点,否则,就会转到默认站点,这个默认站点就是之前配置的主机头为空的那个站点.所以,一个端口只能有一个主机头为空的站点.
我们已经设定由asp.net ISAPI接管这些没有家的孩子.写程序,分析传入的url,执行重写.


为什么我的httpmodule好像没有起作用?

在httpmodule程序里设置断点后,无论怎么样,流程都没有从这里走.原因在于,你没有向web程序注册你的httpmodule程序.这个工作需要在web.config中完成.
<system.web>
<httpModules>
<add type="URLRewriter.ModuleRewriter, URLRewriter"  name="ModuleRewriter" />
</httpModules>
</system.web>


为什么总是提示我”未知的配置节RewriterConfig错误”

这是因为你没有向web程序注册你的RewriterConfig配置节. 这个工作需要在web.config中完成.
<configSections>
<section name="RewriterConfig" type="URLRewriter.Config.RewriterConfigSerializerSectionHandler, URLRewriter" />
</configSections>
然后,你可以在<configuration>里使用RewriterConfig节配置规则了.


url是在httpmodule的哪个部分处理的?

大多的工作是在URLRewriter. ModuleRewriter. Rewrite()方法里.关键阶段是这里:
if (re.IsMatch(requestedPath))
很明显,这个判断传入的url是否是我们要重写的url,大家接着看,
String sendToUrl = RewriterUtils.ResolveUrl(app.Context.Request.ApplicationPath, re.Replace(requestedPath, rules[i].SendTo));
这里接受到web.config中配置的要转到的目标url
RewriterUtils.RewriteUrl(app.Context, sendToUrl);
在内部把url重写.


我不想把二级域名写死在web.config中,而且我要重写的目标url也不能写死.比如我们有这样的需要
Love.kerry.com实际的处理页面是kerry.com/action.aspx?id=1
call.kerryl.com实际的处理页面是kerry.com/action.aspx?id=2
walkwith.kerry.com实际的处理页面是kerry.com/walk.aspx
要怎么处理?


这个时候,就需要在上面说的那几个代码里做手脚.
if (re.IsMatch(requestedPath))
{

//找到url里的二级域名
string [] UserHost = app.Request.Url.Host.Split ( new Char [] { '.' } );
string domain2=UserHost [0];

//根据需要设定要重写的目标url
string sendToUrl ;
if(domain2==” Love”)
  sendToUrl =” /action.aspx?id=1”;
else if(domain2==” call”)
  sendToUrl =” /action.aspx?id=2”;
else i f(domain2==” walkwith”)
  sendToUrl =” /walk.aspx”;

RewriterUtils.RewriteUrl(app.Context, sendToUrl);
    
}

在web.config里配置规则的时候,需要这样
<RewriterRule>
<LookFor>http://(\w+)\.kerry\.com</LookFor>
<SendTo>/test.aspx</SendTo>
</RewriterRule>
(\w+)用来匹配任意字符串
这里的test.aspx随便写别的也可以,因为我们根本没有用它.


我有好多不确定二级域名的站点,但是每个站点的页面确定,每个二级域名站点的内容实际上根剧不同的id从数据库调,
情况如这样
http://localhost/kerry/action.aspx?id=1 love.kerry.com/walk.aspx

http://localhost/kerry/action.aspx?id=14 like.kerry.com/walk.aspx

现在传上去,不能显示id参数,都改成二级域名的方式. 这个时候该怎么办?

首先配置规则
<RewriterRule>
<LookFor>http://(\w+)\.kerry \.com\ walk.aspx</LookFor>
<SendTo>/action.aspx</SendTo>
</RewriterRule>
然后在程序里这样处理
//获取二级域名
string [] UserHost = app.Request.Url.Host.Split ( new Char [] { '.' } );
string domain2=UserHost [0];
根据域名获得不同的编号
int id=getIDfromDomain(domain2);
//获得要转向的基本url
 string sendToUrl = RewriterUtils.ResolveUrl(app.Context.Request.ApplicationPath, re.Replace(requestedPath, rules[i].SendTo));
//加上id参数
if(id>0)
sendToUrl=string.Format ( "{0}?id={1}" , sendToUrl , id );
else
    sendToUrl=”error.aspx”;
//重写
RewriterUtils.RewriteUrl(app.Context, sendToUrl);


如何匹配目录?写了一个lookfor规则 http://love.kerry.com/,但是在浏览器输入这个地址, 总是不能正确的重写,经过trace后发现根本不能匹配,为什么?

首先,我们应该知道,浏览器实际上接受的不是http://love.kerry.com/,而是http://love.kerry.com/default.aspx ,因此,你的</LookFor>规则应该这样写
<LookFor>
http://love.kerry.com/default.aspx
</LookFor>
这个default.aspx应该是你在iis里配置的默认文档,如果你的是index.aspx或其他奇怪的名字,就写成你自己的名字
同样, http://love.kerry.com/fun  这个地址要匹配,需要这样的规则http://love.kerry.com/fun/default.aspx
但是,再罗嗦一句,你的文件根本不需要有fun这个目录,因为...重写了嘛


我搜到网上还有另外一种解决办法…

或许你是指这篇文章

http://blog.csdn.net/mengyao/archive/2007/01/25/1493537.aspx

posted @ 2008-05-03 08:48  MR.WU  阅读(290)  评论(0编辑  收藏  举报