摘要: 1.明确爬虫目的 爬虫目的需要我们明确的,没有目的的爬虫都是耍流氓!像我这次爬虫目的能不能从网页上爬下来。 2.怎么来爬? a. 先要找到具有唯一性的标签 b. 尽量选取匹配的信息 c. 尽量选取他们的父级标签 3. 简单点的爬虫思路 a. 模拟HTTP请求,向服务器发送这个请求,获取到服务器返回给 阅读全文
posted @ 2018-01-18 13:55 呼呼呼呼呼65 阅读(2947) 评论(0) 推荐(0) 编辑