import requests
import parsel
#1.确定网址
url = 'https://ibaotu.com/shipin/7-5023-0-0-0-1.html'
#伪装 字典类型
ua={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.47'}
#2.请求拿到地址 request headers= 是穿上伪装
html=requests.get(url,headers=ua).text
#print(html)
#解析html
s=parsel.Selector(html)
lis = s.xpath('//ul[@class="clearfix"]/li')
#print(lis)
#循环
for l in lis:#循环lis,放到l中
#print(l)
#获取视频所有标题,使用xpath
a=l.xpath('./@pr-data-title').get()#get 去除前边没用的东西
#print(video_title)
#拿到原视频,使用xpath
b=l.xpath('.//video/@src').get()
#print(b)
#拼接
vie_urls='https:'+b
#print(vie_urls)
#重新请求
shipin=requests.get(vie_urls,headers=ua).content#视频图片等都为content
#3.删除不需要的,保留想要的
with open('./包图网存储/%s.mp4' %a, 'wb')as file:#wb允许把二进制代码放入
file.write(shipin)