• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

gisoracle

  • 博客园
  • 联系
  • 订阅
  • 管理

公告

View Post

python爬虫项目-一见倾心壁纸

来自:https://www.cnblogs.com/xdd1997/p/11962969.html
import re import urllib import urllib.request def getHtml(url): page = urllib.request.urlopen(url) html = page.read() return html def getImage(html,x): #https://mmbiz.qpic.cn/mmbiz_jpg/ib55rg6wzUc3B16KIY3uU53nkcTTDic8uEA4WWBPaHJ8LpibvAnkpS2FZtyjrv7w7dbEeNrhfvPuuyReNAxsLdgJA/640?wx_fmt=jpeg #https://mmbiz.qpic.cn/mmbiz_jpg/ib55rg6wzUc3B16KIY3uU53nkcTTDic8uEHqocI7r86nehl2NeForAqvcTiaEAIuWjTWPKNXnnXIPuUuqnuJeFKYw/640?wx_fmt=jpeg #此处正则为重点 reg = 'data-src="(.*?)"' image = re.compile(reg) imlist = re.findall(reg,html.decode('utf-8')) print(imlist) for i in imlist: print(i) print(x) urllib.request.urlretrieve(i,'%s.jpg' % x) x +=1 return x x=1 url = 'https://mp.weixin.qq.com/s/MVDcn0O3093OlIhMYkqBIA' html = getHtml(url) x = getImage(html,x) print('下载完成') #下载结果与此.py文件在同一目录

  

 

posted on 2019-12-07 22:01  gisai  阅读(281)  评论(0)    收藏  举报

刷新页面返回顶部
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3