正则表达式清除Html

正则表达式,去除所有HTML标签

protected void Page_Load(object sender, EventArgs e)
    {
        //string regexstr = @"<[^>]*>";    //去除所有的标签
        //@"<script[^>]*?>.*?</script>" //去除所有脚本,中间部分也删除
         
        // string regexstr = @"<img[^>]*>";   //去除图片的正则
       // string regexstr = @"<(?!br).*?>";   //去除所有标签,只剩br
        // string regexstr = @"<table[^>]*?>.*?</table>";   //去除table里面的所有内容
        string regexstr = @"<(?!img|br|p|/p).*?>";   //去除所有标签,只剩img,br,p
   
        str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);
    }

正则表达式获取HTML中的Img

(src\s?=\s?["|''|\s]?)(\S+/)(\S+\.[^"^''^ ]+)

正则表达式中.代表换行以外任意字符,正则表达式匹配任意字符(包括换行)

([\s\S]*) 

 一直在用的正则表达式工具 Regex Match tracer

 

  

posted @ 2014-09-02 22:05  添哥  阅读(1053)  评论(0)    收藏  举报