摘要:本篇从实际出发,展示如何用网页爬虫。并介绍一个流行的爬虫框架~ 1. 网页爬虫的过程 所谓网页爬虫,就是模拟浏览器的行为访问网站,从而获得网页信息的程序。正因为是程序,所以获得网页的速度可以轻易超过单身多年的手速:)。通常适用于需要大量网页信息的场合。 爬取网页的流程为:访问初始url 获得返回的网 阅读全文
posted @ 2016-10-13 20:48 刀刀流 阅读 (4626) 评论 (0) 编辑