常用正则表达式

1、从Xml中提取Encoding值的
<\?xml\s+[^>]*Encoding=('|")?(?<Encoding>[^>\s'"]*)('|")?[^>]*> 

2、过滤所有HTML标签取纯文本

Code



3、过滤不安全的HTML脚本

Code

4、取所有src链接
(\ssrc=)(?<url>[^>\s]*)  

5、取所有图片链接地址

Code

 6、高亮显示文本内容

Code

         

7、在页面头部找feed链接

<link[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>

例:

Code

         

8、分离Url参数和锚点

Code


9、过滤unicode编码

     \&\#\d*;

 

附:C#中调用正则表达式匹配的代码示例

Code
posted @ 2008-05-04 17:15  litsword  阅读(399)  评论(0)    收藏  举报