随笔分类 - 数据采集
摘要:Html Agility Pack下载地址:http://htmlagilitypack.codeplex.com/Html Agility Pack 源码中的类大概有28个左右,其实不算一个很复杂的类库,但它的功能确不弱,为解析DOM已经提供了足够强大的功能支持,可以跟jQuery操作DOM媲美:...
阅读全文
摘要:Html Agility Pack 源码中的类大概有28个左右,其实不算一个很复杂的类库,但它的功能确不弱,为解析DOM已经提供了足够强大的功能支持,可以跟jQuery操作DOM媲 美:)Html Agility Pack最常用的基础类其实不多,对解析DOM来说,就只有HtmlDocument和Ht...
阅读全文
摘要:foreach(var script in doc.DocumentNode.Descendants("script").ToArray()) script.Remove();foreach(var style in doc.DocumentNode.Descendants("style")....
阅读全文
摘要://选择不包含class属性的节点var result = node.SelectNodes(".//span[not(@class)]");//选择不包含class和id属性的节点var result = node.SelectNodes(".//span[not(@class) and not(...
阅读全文