爬虫_urllib_URLError和HTTPError（异常处理）

简介

1.HTTPError类是URLError类的子类

2.http错误：http错误是针对浏览器无法连接到服务器而增加出来的错误提示。引导并告诉浏览者该页面是哪里出现了问题

3.通过urllib发送请求的时候，有可能会发送失败，这个时候如果想让你的代码更加健壮性，可以通过try-except进行捕获异常，异常有两类，URLError和HTTPError。

# 爬虫中的异常处理

import urllib.request
import urllib.error
#正确地址
# url = 'https://blog.csdn.net/weixin_39709134/article/details/124601777'
# 错误地址
#url = 'https://blog.csdn.net/weixin_39709134/article/details/124601777error'
# 错误的url
url = 'http://www.goudan11.com'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.67 Safari/537.36'
}
try:
    request = urllib.request.Request(url=url,headers=headers)
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    print(content)
except urllib.error.HTTPError:
    print('请求地址错误')
except urllib.error.URLError:
    print('请求url错误')

posted @ 2022-05-23 14:51 创客未来阅读(459) 评论(0) 收藏举报

刷新页面返回顶部

创客未来

爬虫_urllib_URLError和HTTPError（异常处理）

公告