2018年8月24日

Python 爬虫_Urllib库的详解

摘要: Urllib库的详解1. Urllib是python内置的HTTP请求库 包含4个模块: urllib.request(请求模块); urllib.error(异常处理模块); urllib.parse(url解析模块); urllib.robotparse(robots.text解析模块) @ur 阅读全文

posted @ 2018-08-24 17:34 你是不夜星空 阅读(201) 评论(0) 推荐(0)

爬虫基本原理1

摘要: 爬虫基本原理 1. request请求方式: 主要有GET; POST;另外还有HEAD, PUT,DELETE,OPTIONS等; 请求URL:又称资源定位符,类似网页文档,图片,视频都可以用URL唯一来确定; 请求头:包含USER-AGENT,HOST,COOKIES等信息 请求体: 请求时额外 阅读全文

posted @ 2018-08-24 17:33 你是不夜星空 阅读(141) 评论(0) 推荐(0)

导航