爬虫 post请求:

示例网站:如下图 ,要爬的资源不在html文件中,不可用xpath直接取

 

 

先把网络下面的信息清空,再点击页码 出现一下文件

 

 

 但是翻页过程中发现请求头的请求网址是不变的 ,请求方法是post

 

 

 这时候就需要在post请求的data参数加上载荷,可以发现载荷里面有page这个参数,并且与我们翻页对应

 

 

 

 

 

 

 所以可通过如下脚本拿到响应信息,代码如下:

 

 request请求添加headers的简单方法:
直接将浏览器的请求标头复制到引号之间

b"""

"""

 

 

 

 

  一般headers只需要如下几个  带太多反而会报错,如304等错误

 

有的时候,url访问明明200 了,返回内容却并非原网页内容,这个时候需要把网页上所有headers都添加全