摘要: 原理很简单,通过发送resquest请求获取服务器的response,再使用xpath提取其中我们需要的数据,然后保存到文件中。 先看看我爬取的结果: 首先,需要用到的模块有两个: •requests •lxml 第一步,我们先用Chrome的检查分析豆瓣250页面的http请求报头(Request 阅读全文
posted @ 2018-09-03 18:55 WallBreakerX 阅读(374) 评论(0) 推荐(0) 编辑