python - 简单爬取网站图片

 

网址 : https://desk.zol.com.cn/bizhi/9911_119095_2.html

 

 

 

 

1. 爬取网站图片代码   无下载 

import requests
import re
import json

url = 'https://desk.zol.com.cn/bizhi/9911_119096_2.html'
resp = requests.get(url)

# 预加载  写规则
obj = re.compile(r'var deskPicArr.*?= (?P<url>.*?);')

# 在页面中查找
res = obj.search(resp.text)

#查找到的结果提取出来 字符串
res1 = res.group('url')

# 将字符串转化为字典
res1 = json.loads(res1)

#print(res1['list'][0]['resAll'][0])

for item in res1['list']:
    # 有的图片没有 oriSize 尺寸 用下面
    img_size1 = [item][0]['resAll'][0]
   # 图片最大尺寸, 部分图片没有 img_size
= (item.get('oriSize')) img_url = (item.get('imgsrc')) # 替换获取所有图片尺寸 img_url = img_url.replace('##SIZE##', img_size) #保存数据 pass

 

posted @ 2022-05-05 10:57  我在春天等伱  阅读(124)  评论(0)    收藏  举报