摘要: 当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。 HTTP状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用。H 阅读全文
posted @ 2019-09-12 16:22 魏三斗 阅读(4977) 评论(0) 推荐(0)
摘要: urllib是python内置的处理HTTP请求的库,主要包含以下四个模块 request 模块,是最基本的处理HTTP请求的模块。 error 异常处理模块,如果出现请求错误,可以捕获这些错误,保证程序不会意外终止。 parse 模块是一个工具模块,提供了处理url的很多方法。拆分,解析,合并等等 阅读全文
posted @ 2019-09-12 15:25 魏三斗 阅读(982) 评论(0) 推荐(0)
摘要: union()方法返回两个集合的并集,包含所有集合的元素,重复元素只会出现一次。 语法: set.union(set1,set2) 参数: set1必填参数,合并的目标集合 set2选填参数,其他要合并的集合,多个集合之间用逗号隔开。 返回值: 返回一个新的集合。 举例: 阅读全文
posted @ 2019-09-12 10:04 魏三斗 阅读(198) 评论(0) 推荐(0)
摘要: 使用urllib的urljoin()拼接两个地址 urlljoin的第一个参数是基础母站的url,第二个是需要拼接成绝对路径的url。 阅读全文
posted @ 2019-09-12 09:20 魏三斗 阅读(6536) 评论(0) 推荐(0)