C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值

//C#使用正则表达式获取HTML代码中a标签里包含指定后缀的href的值,表达式如下:

Regex regImg = new Regex(@"(?is)<a[^>]*?href=(['""\s]?)(?<href>([^'""\s]*\.doc)|([^'""\s]*\.docx)|([^'""\s]*\.xls)|([^'""\s]*\.xlsx)|([^'""\s]*\.ppt)|([^'""\s]*\.txt)|([^'""\s]*\.zip)|([^'""\s]*\.rar)|([^'""\s]*\.gz)|([^'""\s]*\.bz2))\1[^>]*?>"
posted @ 2016-10-05 01:08  林十八  阅读(490)  评论(0编辑  收藏  举报