爬虫常见异常
常见异常解析与解决方案
异常类型 | 异常原因 | 解决方案 |
ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。 | 短时间内,请求次数过多,导致服务器拒绝访问 | 使用ip池,或者等会儿再试 |
页面获取的中文乱码 | 编码转换问题 |
方案一:获得网页数据之后,直接将响应数据重新编码之后再取值,response_data.encoding='utf-8' 方案二:获取具体内容后,对具体内容进行重新编码,name=name.encode('iso-8859-1').decode('gbk') |
使用浏览器的抓包工具查看请求信息时,提示Paused in debugger | 浏览器打开了测试断点 |
在source中,取消断点激活,然后点击继续|暂停,继续当前请求
|