摘要:
前面有篇文章给出了爬取动态页面的一种思路,即应用Selenium+Firefox(参考《scrapy动态页面爬取》)。但是selenium需要运行本地浏览器,比较耗时,不太适合大规模网页抓取。事实上,还有一种执行效率更高的方法。就是事先分析js发出的GET或者POST... 阅读全文
posted @ 2016-06-08 16:38 jackley 阅读(104) 评论(0) 推荐(0)
对概率统计、大数据科学、机器学习算法感兴趣
posted @ 2016-06-08 16:38 jackley 阅读(104) 评论(0) 推荐(0)
posted @ 2016-06-08 16:35 jackley 阅读(189) 评论(0) 推荐(0)
posted @ 2016-06-08 16:33 jackley 阅读(191) 评论(0) 推荐(0)
posted @ 2016-06-08 16:27 jackley 阅读(103) 评论(0) 推荐(0)