随笔分类 -  爬虫

摘要:如果U校园仅仅是做作业,那么油猴里面的脚本就能满足你了 但是油猴上的U校园脚本并不免费支持系统测试 所以就自己写了一个,虽说实现很简单就是很废头发 (不懂Git的可以直接点右边的code然后download zip,exe在dist里面) 仅供学习交流,使用软件的一切后果,本人概不负责 GitHub 阅读全文
posted @ 2020-05-24 20:23 Sakura_Momoko 阅读(5084) 评论(4) 推荐(2)
摘要:千千音乐可能是第一次爬(没爬到vip),但后来我成功爬到了qq和酷我的vip音乐 我觉得难度肯定是qq>kuwo>千千吧 千千和酷我在 上篇 已经有了就不再重复了这篇详细讲讲qq音乐 qq音乐 找到一首歌的播放url 直接随便搜一首歌点播放进入播放页面 发现media里面有文件(良心)进入这个url 阅读全文
posted @ 2020-03-09 13:01 Sakura_Momoko 阅读(1256) 评论(0) 推荐(0)
摘要:我回来填坑了... 阅读全文
posted @ 2020-03-06 14:10 Sakura_Momoko 阅读(1680) 评论(0) 推荐(0)
摘要:头文件 from bs4 import Beautifulsoup 编译器(不太懂html): 似乎有lxml和html.parser?(一个用不了用另一个)lxml似乎要先下载 自动识别文件编码形式并转换文件内容: from bs4 import UnicodeDammit dammit=Unic 阅读全文
posted @ 2020-03-04 09:46 Sakura_Momoko 阅读(197) 评论(0) 推荐(0)
摘要:多线程 用不了多核!IO密集优势更大(比如下载文件啊...) 一般的python程序都是前台运行(主线程),即代表了顺序运行只有前面一个运行完毕后才能运行后面一个,但这样有时候会很浪费时间,比如下载两个数据第一个数据单独下载耗时t1而第二个单独下载耗时t2,时间是t1+t2,但是你将这个两个程序放入 阅读全文
posted @ 2020-03-04 09:40 Sakura_Momoko 阅读(215) 评论(0) 推荐(0)