2009年1月6日
摘要: 最近在写一个小程序的时候,遇到这样的需求:已知一组网页url地址,想获取每一个网页的html,实际上就是想利用循环语句里面使用WebBrowser来加载每一个网页,然后获取他们的html, 要实现这个功能,想想应该是件很简单的事情,但是在实际操作中却遇到了问题,因为循环语句和WebBrowser的加载不同步的原因,导致前一个前一个网页还没加载完,下一次循环又开始了....最终的结果是WebBrow... 阅读全文
posted @ 2009-01-06 22:28 xiaohu 阅读(9259) 评论(8) 推荐(1)
摘要: using System.Text.RegularExpressions;private string StripHT(string strHtml) //从html中提取纯文本 { Regex regex = new Regex("<.+?>", RegexOptions.IgnoreCase); string strOutput = regex.Replace(strHtml, "... 阅读全文
posted @ 2009-01-06 17:26 xiaohu 阅读(2007) 评论(0) 推荐(0)