requests库

requests 是python最简单易用的HTTP

 

requests的各个请求方式:

import requests:

requests.get(url)

requests.post(url)

requests.put(url)

requests.delete(url)

requests.head(url)

requests.options(url)

 

用requests爬取指定网站的步骤:

1.导入一个requests包

2.用get.()来获取你想访问的网页地址

3.获取网页的标准编码

4.获取响应的文本信息

import requests#导入request包
url = "https://www.baidu.com"#爬取网页的地址
res = requests.get(url) #用get请求方式发送一个请求
res.encoding = res.apparent_encoding #获取网页的标准编码
print(res.text) #获取响应的文本信息(字符编码)
f = open("baidu.html","wb")#创建一个文件
f.write(res.content)#把爬取的数据放进文件中
f.close()#关闭

 

posted @ 2021-05-13 15:37  江南知我意的南  阅读(136)  评论(0)    收藏  举报