这是一个简单的爬虫
只访问网站的头,并返回结果
import requests #先导入爬虫的库,不然调用不了爬虫的函数
headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"}#设置头部信息,伪装浏览器
url = "http://baidu.com"
response = requests.get( url , headers=headers)#get方法访问,传入headers参数,
response.encoding = "utf-8" #设置接收编码格式
print("\nr的类型" + str( type(response) ) )
print("\n状态码是:" + str( response.status_code ) )
print("\n头部信息:" + str( response.headers ) )
print( "\n响应内容:" )
print( response.text )
'''
1.
保存文件
file = open("D:\pycode\173.html","w",encoding="utf") #打开一个文件,w是文件不存在则新建一个文件,这里不用wb是因为不用保存成二进制
file.write( response.text )
file.close()
2.
file = open("D:\pycode\logo.jpg","wb") #打开一个文件,wb表示以二进制格式打开一个文件只用于写入
file.write(response.content) #写入文件
file.close()
'''

浙公网安备 33010602011771号