.net对html的抓取
摘要:
最近在项目里需要用到一个小功能,很小很小的功能,就是抓取指定网站上的内容,但是这个网站刚好是用Ajax进行加载主要内容的,这时按平时用的webclient等去抓取是无法抓取到Ajax加载的内容的,用httpwatch等分析后再模拟Post,这个成本有点高了,因为这只是一个很小的功能而已。在博客园上发问后得到了几个方法,有用nodejs的,有用Selenium的,有用phantomjs的,开始对nodejs进行研究,看了一些介绍,也都放弃了,开发指南_中文正版.pdf,这个文档是其中文版说明。下面说一下其他的两个方法:Selenium,这个selenium-dotnet-strongnamed- 阅读全文
posted @ 2013-08-31 23:59
YYLin
阅读(755)
评论(0)
推荐(0)