Python从包图网爬取图片保存到本地

import requests
import parsel
#1.确定网址
url = 'https://ibaotu.com/shipin/7-5023-0-0-0-1.html'
#伪装 字典类型
ua={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.47'}
#2.请求拿到地址 request headers= 是穿上伪装
html=requests.get(url,headers=ua).text
#print(html)
#解析html
s=parsel.Selector(html)

lis = s.xpath('//ul[@class="clearfix"]/li')
#print(lis)
#循环
for l in lis:#循环lis，放到l中
     #print(l)
#获取视频所有标题，使用xpath
     a=l.xpath('./@pr-data-title').get()#get 去除前边没用的东西
     #print(video_title)
     #拿到原视频，使用xpath
     b=l.xpath('.//video/@src').get()
     #print(b)
     #拼接
     vie_urls='https:'+b
     #print(vie_urls)
     #重新请求
     shipin=requests.get(vie_urls,headers=ua).content#视频图片等都为content
#3.删除不需要的，保留想要的
     with open('./包图网存储/%s.mp4' %a, 'wb')as file:#wb允许把二进制代码放入
         file.write(shipin)

posted @ 2022-06-08 17:41 橙大力阅读(142) 评论(0) 收藏举报

刷新页面返回顶部

Python从包图网爬取图片保存到本地

公告