随笔分类 - Python爬虫
摘要:webpack注意事项 1.开头进行补环境 window = global (先运行,看哪些环境需要进行补) 2.在加载函数中,注释初始化,一般在加载器函数中(最后一行)的进行注释 例如: // o(o.s = 0) 3.全局要调用加载器函数(看加载器函数中调用的是哪个对象就调用哪个全局变量) 例如
阅读全文
摘要:1.js逆向的准备工作(查找解密加密的方法) 1.1 选择合适的触发事件,排除干扰请求 想要爬取什么内容就选中哪个地方发起请求,排除其他请求的干扰 就比如下图,需要爬取通知公告,就先清除网站的其他请求,然后再点击需要爬取的地方(这时候就默认发起请求) 1.2 注意请求中的请求载荷(负载,就是需要的参
阅读全文
摘要:PyExecJS介绍 PyExecJS 是一个可以使用 Python 来模拟运行 JavaScript 的库。 使用该模块可以通过python程序调用执行js代码,获取js代码返回的结果! 注意事项:电脑必须安装好了nodejs开发环境上述模块才可以生效! 环境安装: pip install PyE
阅读全文
摘要:1.base64加密 base64是什么 Base64编码,是由64个字符组成编码集:26个大写字母AZ,26个小写字母az,10个数字0~9,符号“+”与符号“/”。Base64编码的基本思路是将原始数据的三个字节拆分转化为四个字节,然后根据Base64的对应表,得到对应的编码数据。 当原始数据凑
阅读全文
摘要:验证码识别平台 图鉴平台:http://www.ttshitu.com/ (推荐) 超级鹰:https://www.chaojiying.com/about.html 使用流程: 注册登录图鉴平台 登录后,点击开发文档,提取识别的源代码 模块(tujian.py)的封装: tujian.py imp
阅读全文

浙公网安备 33010602011771号