摘要: 爬取b站博人传 每页短评20个,页数超过1000页, 代码如下 在爬取过程中发现,每当递归到999会发生异常 这个函数在递归自身是发生的异常 只需要在程序开头添加 防止内存爆炸 阅读全文
posted @ 2019-06-04 11:29 花名k 阅读(3395) 评论(0) 推荐(0)
摘要: 第一点是 js 进行了加密, 通常是需要进行一些参数传递,比如有道翻译,那种加密很简单,只需要在进行推演就可以知道加密的数值是什么样子的, 百度翻译sign的数值进行了js函数加密,如果是不懂js,那么很难进行反加密 解决方法有 通过selenium 其他途径,app,web 第二种则是动态字体文件 阅读全文
posted @ 2019-06-04 05:01 花名k 阅读(955) 评论(0) 推荐(0)