这是一个简单的爬虫

只访问网站的头，并返回结果

import requests #先导入爬虫的库，不然调用不了爬虫的函数
headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36"}#设置头部信息,伪装浏览器
url = "http://baidu.com"
response = requests.get( url , headers=headers)#get方法访问,传入headers参数，
response.encoding = "utf-8" #设置接收编码格式
print("\nr的类型" + str( type(response) ) )
print("\n状态码是:" + str( response.status_code ) )
print("\n头部信息:" + str( response.headers ) )
print( "\n响应内容:" )
print( response.text )
'''
1.

保存文件

file = open("D:\pycode\173.html","w",encoding="utf") #打开一个文件，w是文件不存在则新建一个文件，这里不用wb是因为不用保存成二进制
file.write( response.text )
file.close()
2.
file = open("D:\pycode\logo.jpg","wb") #打开一个文件,wb表示以二进制格式打开一个文件只用于写入
file.write(response.content) #写入文件
file.close()
'''

posted @ 2020-11-13 17:56 伟偉阅读(61) 评论(0) 收藏举报

刷新页面返回顶部

伟偉

这是一个简单的爬虫

保存文件

公告