摘要: 上礼拜我在博客园发布了一篇关于网页数据分析和采集的文章,后来看过文章评论才知道原来现在已经有HtmlAgilityPack这个类库可以更方便地对HTML内容进行分析和提取。因此今天特别学习和实践了一下HtmlAgilityPack和XPath,并作下笔记。1.下载HtmlAgilityPack.dll并将其添加引用到项目中,然后在代码中声明引用。下载地址:http://www.codeplex.com/htmlagilitypack引用:usingHtmlAgilityPack;2.下载获取HTML页面的步骤和我上篇文章里介绍的差不多,都是先用WebClient或者WebRequest类来下载 阅读全文
posted @ 2011-06-20 16:41 悠游人生 阅读(6369) 评论(6) 推荐(8)