博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

[转载]ASP 去除HTML标签正则表达应用

Posted on 2007-05-25 10:31  David Wang  阅读(2051)  评论(3编辑  收藏  举报

在CSDN上面找到的代码,希望通过转载能叫更多需要的人得到帮忙,具体的代码的解释上面都有就不多说了,转载请加上原作者的信息。

<%   
  
'/*   函数名称:Zxj_ReplaceHtml ClearHtml   
  '/*   函数语言:VBScript   Language     
  '/*   作  用:清除文件HTML格式函数   
  '/*   传递参数:Content   (注:需要进行清除的内容)   
  '/*   函数作者:张晓军(古城童话) QQ:382511147   
  '/*   函数说明:正则匹配(正则表达式)模式进行数据匹配替换   
    
  
Function   ClearHtml(Content)   
  Content
=Zxj_ReplaceHtml("&#[^>]*;",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?marquee[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?object[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?param[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?embed[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?table[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("&nbsp;","",Content)   
  Content
=Zxj_ReplaceHtml("</?tr[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?th[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?p[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?a[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?img[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?tbody[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?li[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?span[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?div[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?th[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?td[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?script[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("(javascript|jscript|vbscript|vbs):",   "",   Content)   
  Content
=Zxj_ReplaceHtml("on(mouse|exit|error|click|key)",   "",   Content)   
  Content
=Zxj_ReplaceHtml("<\\?xml[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("<\/?[a-z]+:[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?font[^>]*>",   "",   Content)   
  Content
=Zxj_ReplaceHtml("</?b[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?u[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?i[^>]*>","",Content)   
  Content
=Zxj_ReplaceHtml("</?strong[^>]*>","",Content)   
  ClearHtml
=Content   
  
End   Function   
    
  
Function   Zxj_ReplaceHtml(patrn,   strng,content)   
  
IF   IsNull(content)   Then   
  content
=""   
  
End   IF   
  
Set   regEx   =   New   RegExp '   建立正则表达式。   
  regEx.Pattern   =   patrn '   设置模式。   
  regEx.IgnoreCase   =   true             '   设置忽略字符大小写。   
  regEx.Global   =   True '   设置全局可用性。   
  Zxj_ReplaceHtml=regEx.Replace(content,strng) '   执行正则匹配   
  End   Function   
  %
>  

将以上代码保存为 HtmlModify.asp   以后在需要清除HTML的文件中使用  
  <!--#include   file=HtmlModify.asp-->  
  调用函数 ClearHtml() 即可  
   
  使用方法为  ClearHtml(Content)   其中   Content 为欲清除的代码存放的变量