猿人学第三题比赛题目
开始水第三篇,哈哈哈哈
URL:http://match.yuanrenxue.com/match/3

老规矩:F12,刷新

上面两个一个是名单,一个是空,所以此次请求有关的就是在下面两个
logo后面的状态码是202,看下202状态码的解释:

点击,打开我们看一下

就是一个链接,再看看其他的

POST + 202,假想一下,表单提交了某个东西到服务器,但是并未处理,像不像正在验证什么东西
接着往下看

那么可以确定,点击这个网页

通过POST访问上面整个网址,设置sessionid,好,先假想第一个请求,接下来看第二个

这其实就是有数据的一个请求

200 + GET + 数据是不是就和之前的假想一样了
现在已经很清楚了,先这样再那样再那样,我好了,你们呢~
不要慌,我们再来个断点看看~
断哪里呢,哪里有数据就断哪里


直接来看这里~
不懂js都可以的啦,POST + /logo,
通过request的session.post请求/logo再通过session.get请求3
忘记session那块内容的,这里推荐https://python3webspider.cuiqingcai.com/
复习下2.4章及其他的内容
爬取情况如下:


本文来自博客园,作者:黑山老道,转载请注明原文链接:https://www.cnblogs.com/meipu/p/13884726.html

浙公网安备 33010602011771号