爬虫_urllib_URLError和HTTPError(异常处理)

简介

1.HTTPError类是URLError类的子类

2.http错误:http错误是针对浏览器无法连接到服务器而增加出来的错误提示。引导并告诉浏览者该页面是哪里出现了问题

3.通过urllib发送请求的时候,有可能会发送失败,这个时候如果想让你的代码更加健壮性,可以通过try-except进行捕获异常,异常有两类,URLError和HTTPError。

 

# 爬虫中的异常处理

import urllib.request
import urllib.error
#正确地址
# url = 'https://blog.csdn.net/weixin_39709134/article/details/124601777'
# 错误地址
#url = 'https://blog.csdn.net/weixin_39709134/article/details/124601777error'
# 错误的url
url = 'http://www.goudan11.com'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.67 Safari/537.36'
}
try:
    request = urllib.request.Request(url=url,headers=headers)
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    print(content)
except urllib.error.HTTPError:
    print('请求地址错误')
except urllib.error.URLError:
    print('请求url错误')

 

posted @ 2022-05-23 14:51  创客未来  阅读(438)  评论(0)    收藏  举报