摘要:最近看过不少讲爬虫的教程[1][2],基本都是一个模式: 1. 开始先来拿正则、lxml、jquery/pyquery等等教大家从页面上抠出一个一个的值来 2. 然后深入一些在讲讲http 协议,讲讲怎么拿出 cookie 来模拟登录之类的,讲讲基本的反爬虫和反反爬虫的方法 3. 最后在上一个 简单 阅读全文
posted @ 2017-04-30 23:30 ospider 阅读 (5543) 评论 (2) 编辑