爬虫初试

1.下载谷歌浏览器

2.在谷歌浏览器内打开百度

3.打开百度的开发者工具：ctrl+shift+I

5.关注内容解释：

headers:
general内：
    http 协议
    请求url：https://www.baidu.com/
    请求方式：get
    响应状态码：

request headers :请求头部
cookie:缓存数据，用来保存用户的浏览信息)(如用于避免登录的，跳开登录验证)
user-Agent: 他是用来证明你是否是浏览器，

6. requests模块的使用

#pip install -i 清华源地址 模块名    ##可以改变下载源，从默认的国外网站到国内的想去的网址
#也可以永久修改
##修改sit-package ，下面的models 里面的index.py  修改里面的PyPI即可

import requests  ##载入requests模块

以下代码用于保存当前打开的baidu的页面，并保存在对应文件中

import requests

response =requests.get(url='https://www.baidu.com/')     #往百度发送请求
response.encoding='utf-8'
print(response)   #返回对象<Response [200]>
print(response.status_code)   #拥于返回响应状态码
print(response.text)   #拥于返回响应文本,返回str类型

with open('baidu.html','w',encoding='utf-8') as f :
    f.write(response.text)

7.网上爬取视频：

import requests

res = requests.get('https://video.pearvideo.com/mp4/adshort/20190613/cont-1565846-14013215_adpkg-ad_hd.mp4')


print(res.content)

with open ('aa.mp4','wb') as f:
    f.write(res.content)

　　说明：获取视频源的办法：用谷歌浏览器打开梨视频，然后打开开发者模式，然后点开element ，然后选择相应的视频，然后点击工具中的箭头，然后点一下相关位置，然后对应的视频源就会出现。然后双击后即可复制。

https://www.cnblogs.com/kermitjam/p/10863913.html

posted @ 2019-06-13 16:23 evan0925 阅读(169) 评论(0) 收藏举报

刷新页面返回顶部

evan0925

爬虫初试

公告