爬虫常见异常

 

 

常见异常解析与解决方案

异常类型 异常原因 解决方案
ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。  短时间内,请求次数过多,导致服务器拒绝访问  使用ip池,或者等会儿再试
页面获取的中文乱码 编码转换问题

方案一:获得网页数据之后,直接将响应数据重新编码之后再取值,response_data.encoding='utf-8'

方案二:获取具体内容后,对具体内容进行重新编码,name=name.encode('iso-8859-1').decode('gbk')

 使用浏览器的抓包工具查看请求信息时,提示Paused in debugger 浏览器打开了测试断点 

 在source中,取消断点激活,然后点击继续|暂停,继续当前请求

 

 

     
posted @ 2020-02-21 17:17  林山风火  阅读(230)  评论(0编辑  收藏  举报