随笔分类 - 爬虫
摘要:如果U校园仅仅是做作业,那么油猴里面的脚本就能满足你了 但是油猴上的U校园脚本并不免费支持系统测试 所以就自己写了一个,虽说实现很简单就是很废头发 (不懂Git的可以直接点右边的code然后download zip,exe在dist里面) 仅供学习交流,使用软件的一切后果,本人概不负责 GitHub
阅读全文
摘要:千千音乐可能是第一次爬(没爬到vip),但后来我成功爬到了qq和酷我的vip音乐 我觉得难度肯定是qq>kuwo>千千吧 千千和酷我在 上篇 已经有了就不再重复了这篇详细讲讲qq音乐 qq音乐 找到一首歌的播放url 直接随便搜一首歌点播放进入播放页面 发现media里面有文件(良心)进入这个url
阅读全文
摘要:头文件 from bs4 import Beautifulsoup 编译器(不太懂html): 似乎有lxml和html.parser?(一个用不了用另一个)lxml似乎要先下载 自动识别文件编码形式并转换文件内容: from bs4 import UnicodeDammit dammit=Unic
阅读全文
摘要:多线程 用不了多核!IO密集优势更大(比如下载文件啊...) 一般的python程序都是前台运行(主线程),即代表了顺序运行只有前面一个运行完毕后才能运行后面一个,但这样有时候会很浪费时间,比如下载两个数据第一个数据单独下载耗时t1而第二个单独下载耗时t2,时间是t1+t2,但是你将这个两个程序放入
阅读全文

浙公网安备 33010602011771号