随笔分类 -  python3爬虫实练

摘要:网站:http://www.meizitu.com/目标:用BeautifulSoup解析网页源代码,获取图片.图片链接:# /home/wl/PycharmProjects/untitled# -*- coding:utf-8 -*-# author:龙from b... 阅读全文
posted @ 2018-08-10 19:47 龙~白 阅读(1338) 评论(0) 推荐(0)
摘要:网站:http://www.quanshuwang.com/目标:爬取小说内容步骤:打开一本小说源代码 获取各个章节的链接 打开各个章节的源代码 提取各个章节的内容 下载内容小说链接如下:http://www.quanshuwang.com/book/9/9055(每... 阅读全文
posted @ 2018-08-09 21:01 龙~白 阅读(2236) 评论(0) 推荐(0)
摘要:网站:www.minimp4.com# coding=utf-8import requestsfrom lxml import etreeclass Minimpe_moves(object): def Getmovies(self,page): ... 阅读全文
posted @ 2018-08-09 00:01 龙~白 阅读(592) 评论(0) 推荐(0)
摘要:首先用火狐浏览器进入12306网站的登录界面,F12获取登录界面的url地址.再获取验证码图片的链接及其验证码校正所post的数据最后获取用户名和密码的登录链接及其post的数据# coding=utf-8import requestsimport os#下载验证码图... 阅读全文
posted @ 2018-08-08 17:03 龙~白 阅读(424) 评论(0) 推荐(0)
摘要:网站:http://www.lovewzly.com/jiaoyou.html工具:python3 ,pycharm ,火狐浏览器自带F12功能目标:获取妹子信息,将图片与个人信息分开保存在不同文件夹下步骤:分为一下四步:设置条件 解析网页 下载图片 保存信息# co... 阅读全文
posted @ 2018-08-07 16:26 龙~白 阅读(205) 评论(0) 推荐(0)