Python从包图网爬取图片保存到本地

import requests
import parsel
#1.确定网址
url = 'https://ibaotu.com/shipin/7-5023-0-0-0-1.html'
#伪装 字典类型
ua={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.47'}
#2.请求拿到地址 request headers= 是穿上伪装
html=requests.get(url,headers=ua).text
#print(html)
#解析html
s=parsel.Selector(html)

lis = s.xpath('//ul[@class="clearfix"]/li')
#print(lis)
#循环
for l in lis:#循环lis,放到l中
     #print(l)
#获取视频所有标题,使用xpath
     a=l.xpath('./@pr-data-title').get()#get 去除前边没用的东西
     #print(video_title)
     #拿到原视频,使用xpath
     b=l.xpath('.//video/@src').get()
     #print(b)
     #拼接
     vie_urls='https:'+b
     #print(vie_urls)
     #重新请求
     shipin=requests.get(vie_urls,headers=ua).content#视频图片等都为content
#3.删除不需要的,保留想要的
     with open('./包图网存储/%s.mp4' %a, 'wb')as file:#wb允许把二进制代码放入
         file.write(shipin)

 

posted @ 2022-06-08 17:41  橙大力  阅读(142)  评论(0)    收藏  举报