记一次遇到的 post 请求的 data参数处理和 headers的快捷书写

爬虫 post请求：

示例网站：如下图，要爬的资源不在html文件中，不可用xpath直接取

、

先把网络下面的信息清空，再点击页码出现一下文件

但是翻页过程中发现请求头的请求网址是不变的，请求方法是post

这时候就需要在post请求的data参数加上载荷，可以发现载荷里面有page这个参数，并且与我们翻页对应

所以可通过如下脚本拿到响应信息，代码如下：

request请求添加headers的简单方法：
直接将浏览器的请求标头复制到引号之间

b"""
    
"""

一般headers只需要如下几个带太多反而会报错，如304等错误

有的时候，url访问明明200 了，返回内容却并非原网页内容，这个时候需要把网页上所有headers都添加全

posted on 2022-10-20 11:40 明媚的夏午阅读(377) 评论(0) 收藏举报

刷新页面返回顶部

导航