2017 年 5月随笔档案 - `Elaine

python爬取漫画

摘要：抓取漫画的网址是：sf互动传媒抓取漫画的由来也是看了知乎上有人说用爬取漫画，然后自己也玩玩首页中每个漫画的url是类似这样存储的：然后用lxml通过cssselect(tr>td>a)将能用到的解析出来，然后解析出来会有很多其他的页面的url和信息，然后我是通过url中包含"/mh/"或者是" 阅读全文

posted @ 2017-05-31 00:56 `Elaine 阅读(3068) 评论(0) 推荐(1)

python爬取网易云音乐歌单音乐

摘要：在网易云音乐中第一页歌单的url：http://music.163.com/#/discover/playlist/ 依次第二页：http://music.163.com/#/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&o 阅读全文

posted @ 2017-05-14 03:23 `Elaine 阅读(16115) 评论(0) 推荐(0)

python 爬图

摘要：利用bs库进行爬取，在下载html时，使用代理user_agent来下载，并且下载次数是2次，当第一次下载失败后，并且http状态码是500-600之间，然后会重新下载一次阅读全文

posted @ 2017-05-10 23:37 `Elaine 阅读(270) 评论(0) 推荐(0)

05 2017 档案

python爬取漫画

python爬取网易云音乐歌单音乐

python 爬图

导航

公告