摘要: 3.爬取网页的通用代码框架 爬取网页的通用代码框架:指可以准确、可靠地爬取网页内容的一组代码。 3.1异常处理 使用get()方法时并不一定能够成功获取信息,所以首先明确异常处理非常重要。 理解Requests库的异常 异常 说明 requests.ConnectionError 网络连接错误异常, 阅读全文
posted @ 2022-04-29 16:31 CharlesZ 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 2.Requests库的get()方法 get()方法的完整格式: r = requests.get(url,params=None,**kwargs) 获取网页资源的最简单代码:r = requests.get(url),通过get方法构造一个向服务器请求资源的Request对象,返回一个包含服务 阅读全文
posted @ 2022-04-26 20:52 CharlesZ 阅读(329) 评论(0) 推荐(0) 编辑
摘要: 1.Requests库的主要方法解析 7个主要方法 方法 说明 requests.request() 构造一个请求,支撑以下各方法的基础方法 requests.get() 获取HTML网页的主要方法 requests.head() 获取HTML网页头部信息的方法 requests.post() 向H 阅读全文
posted @ 2022-04-25 01:58 CharlesZ 阅读(179) 评论(0) 推荐(0) 编辑