首页  :: 新随笔  :: 订阅 订阅  :: 管理

提取网页中的超链接的link和text部分~

Posted on 2008-12-17 15:31  礼拜一  阅读(554)  评论(1编辑  收藏  举报
string s = "..";   
Regex re 
= new Regex(@"<a[^>]*href=(""(?<href>[^""]*)""|'(?<href>[^']*)'|(?<href>[^\s>]*))[^>]*>(?<text>.*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Singleline);   
Match m  
= re.Match(s);   
if(m.Success)   
{   
  
string link = m.Groups["href"].Value;   
  
string text = Regex.Replace(m.Groups["text"].Value,"<[^>]*>","");   
  Console.WriteLine(
"link:{0}\ntext:{1}", link, text);   
}