随笔分类 -  数据采集

摘要:Html Agility Pack下载地址:http://htmlagilitypack.codeplex.com/Html Agility Pack 源码中的类大概有28个左右,其实不算一个很复杂的类库,但它的功能确不弱,为解析DOM已经提供了足够强大的功能支持,可以跟jQuery操作DOM媲美:... 阅读全文
posted @ 2015-11-13 18:16 阅读(985) 评论(3) 推荐(0)
摘要:Html Agility Pack 源码中的类大概有28个左右,其实不算一个很复杂的类库,但它的功能确不弱,为解析DOM已经提供了足够强大的功能支持,可以跟jQuery操作DOM媲 美:)Html Agility Pack最常用的基础类其实不多,对解析DOM来说,就只有HtmlDocument和Ht... 阅读全文
posted @ 2015-11-13 13:57 阅读(1072) 评论(0) 推荐(0)
摘要:foreach(var script in doc.DocumentNode.Descendants("script").ToArray()) script.Remove();foreach(var style in doc.DocumentNode.Descendants("style").... 阅读全文
posted @ 2015-11-12 17:47 阅读(3762) 评论(0) 推荐(0)
摘要://选择不包含class属性的节点var result = node.SelectNodes(".//span[not(@class)]");//选择不包含class和id属性的节点var result = node.SelectNodes(".//span[not(@class) and not(... 阅读全文
posted @ 2015-11-12 16:25 阅读(974) 评论(0) 推荐(0)