python3: requests模块的使用;
requests库常用于http请求,可以很方便对网页进行爬取;
主要方法(七个):
| 方法 | 解释 |
|---|---|
| requests.request() | 构造一个请求,支持以下各种方法 |
| requests.get() | 获取html的主要方法 |
| requests.head() | 获取html头部信息的主要方法 |
| requests.post() | 向html网页提交post请求的方法 |
| requests.put() | 向html网页提交put请求的方法 |
| requests.patch() | 向html提交局部修改的请求 |
| requests.delete() | 向html提交删除请求 |
1.requests.get
原型:
r = requests.get(url,params, **kwargs)
url: 网站地址;
params: 参数, 额外参数,可以使字典或者字节流
**kwargs: 12个控制访问的参数( 这里不讲述);
响应response对象有以下属性:
| 属性 | 说明 |
|---|---|
| r.status_code | http请求的返回状态,若为200则表示请求成功。 |
| r.text | http响应内容的字符串形式,即返回的页面内容 |
| r.encoding | 从http header 中猜测的相应内容编码方式 |
| r.apparent_encoding | 从内容中分析出的响应内容编码方式(备选编码方式) |
| r.content | http响应内容的二进制形式 |
其他略(请见: https://blog.csdn.net/gyq1998/article/details/78583841)

浙公网安备 33010602011771号