摘要: 常见Python爬虫工具总结 前言 以前写爬虫都是用requests包,虽然很好用,不过还是要封装一些header啊什么的,也没有用过无头浏览器,今天偶然接触了一下。 原因是在处理一个 "错误" 的时候,用到了几个以前没有用过的工具;这几个工具也挺常见的,在这里一起总结一下。包括以下几个: sele 阅读全文
posted @ 2018-08-02 11:02 wswang 阅读(2066) 评论(0) 推荐(0) 编辑
摘要: 前言 以前抓网页都是直接requests+bs4直接刚的,今天想拿一下拉钩的数据,就继续按照以下步骤来了: 先找个想爬的网页,然后写解析功能 批量爬,然后解析 入库 探究 结果发现行不通了,用bs4去解析,结果连title都拿不到,而网页源码里明明是有的!于是用浏览器打开网页然后view sourc 阅读全文
posted @ 2018-08-02 10:39 wswang 阅读(3167) 评论(0) 推荐(0) 编辑