常用正则表达式

1、从Xml中提取Encoding值的
<\?xml\s+[^>]*Encoding=('|")?(?<Encoding>[^>\s'"]*)('|")?[^>]*> 

2、过滤所有HTML标签取纯文本

Code



3、过滤不安全的HTML脚本

Code

4、取所有src链接
(\ssrc=)(?<url>[^>\s]*)  

5、取所有图片链接地址

Code

 6、高亮显示文本内容

Code

         

7、在页面头部找feed链接

<link[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>

例:

Code

         

8、分离Url参数和锚点

Code


9、过滤unicode编码

     \&\#\d*;

 

附:C#中调用正则表达式匹配的代码示例

Code

posted on 2008-05-04 17:15 litsword 阅读(57) 评论(0)  编辑 收藏


标题  
姓名  
主页
Email (博主才能看到) 
验证码 *  看不清,换一张 [登录][注册]
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
该文被作者在 2008-05-04 17:18 编辑过


相关链接:
 


<2008年10月>
2829301234
567891011
12131415161718
19202122232425
2627282930311
2345678

导航

统计

公告

开博啦~^^ 在此记录下自己程序员生涯累积的点点滴滴~

与我联系

搜索

 

常用链接

留言簿

我的标签

随笔分类