requests库
requests 是python最简单易用的HTTP
requests的各个请求方式:
import requests:
requests.get(url)
requests.post(url)
requests.put(url)
requests.delete(url)
requests.head(url)
requests.options(url)
用requests爬取指定网站的步骤:
1.导入一个requests包
2.用get.()来获取你想访问的网页地址
3.获取网页的标准编码
4.获取响应的文本信息
import requests#导入request包
url = "https://www.baidu.com"#爬取网页的地址
res = requests.get(url) #用get请求方式发送一个请求
res.encoding = res.apparent_encoding #获取网页的标准编码
print(res.text) #获取响应的文本信息(字符编码)
f = open("baidu.html","wb")#创建一个文件
f.write(res.content)#把爬取的数据放进文件中
f.close()#关闭
浙公网安备 33010602011771号