05 2017 档案

python爬取漫画
摘要:抓取漫画的网址是:sf互动传媒 抓取漫画的由来也是看了知乎上有人说用爬取漫画,然后自己也玩玩 首页中每个漫画的url是类似这样存储的: 然后用lxml通过cssselect(tr>td>a)将能用到的解析出来,然后解析出来会有很多其他的页面的url和信息,然后我是通过url中包含"/mh/"或者是" 阅读全文

posted @ 2017-05-31 00:56 `Elaine 阅读(3068) 评论(0) 推荐(1)

python爬取网易云音乐歌单音乐
摘要:在网易云音乐中第一页歌单的url:http://music.163.com/#/discover/playlist/ 依次第二页:http://music.163.com/#/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&o 阅读全文

posted @ 2017-05-14 03:23 `Elaine 阅读(16115) 评论(0) 推荐(0)

python 爬图
摘要:利用bs库进行爬取,在下载html时,使用代理user_agent来下载,并且下载次数是2次,当第一次下载失败后,并且http状态码是500-600之间,然后会重新下载一次 阅读全文

posted @ 2017-05-10 23:37 `Elaine 阅读(270) 评论(0) 推荐(0)

导航