摘要: 虽然微博官方有Python SDK,但是下载链接竟然失效了??在Pypi找到一个库——weibo,貌似还不错 安装weibo库 pip install weibo 报错 “ERROR: Command errored out with exit status 1: python setup.py e 阅读全文
posted @ 2020-01-17 22:40 Rogn 阅读(1485) 评论(0) 推荐(0) 编辑
摘要: 分析 一般地,QQ空间可以通过手机QQ扫码登录和账号密码登录。但是账号密码登录有时候需要验证码,为了保证登录的成功率,我们选择扫码登录的方式。 首先,进入登录界面: https://xui.ptlogin2.qq.com/cgi-bin/xlogin?proxy_url=https://qzs.qq 阅读全文
posted @ 2020-01-17 20:54 Rogn 阅读(2603) 评论(1) 推荐(0) 编辑
摘要: Tesseract的安装 windows安装包:https://digi.bib.uni-mannheim.de/tesseract/,最后一个是最新的。 默认安装路径 C:\Program Files (x86)\Tesseract-OCR, 将其添加到系统环境变量Path。 安装完成之后,在命令 阅读全文
posted @ 2020-01-17 16:20 Rogn 阅读(1833) 评论(0) 推荐(0) 编辑
摘要: 伪装头部是最基本的反反爬虫方法,下面假设我们有一个网站: from flask import Flask app = Flask(__name__) @app.route('/getInfo') def hello_world(): return "这里假装有很多数据" @app.route('/' 阅读全文
posted @ 2020-01-17 14:09 Rogn 阅读(1307) 评论(0) 推荐(0) 编辑
摘要: 安装可见 https://www.cnblogs.com/lfri/p/10542797.html 简单使用 百度自动搜索的例子: from selenium import webdriver driver = webdriver.Chrome() driver.get("https://www.b 阅读全文
posted @ 2020-01-17 12:05 Rogn 阅读(458) 评论(0) 推荐(0) 编辑
摘要: 在python中,常用的多线程的模块有这么几个 _thread threading Queue 之前有个 thread 模块,被 python3 抛弃了,改名为 _thread。 但其实 _thread 也没什么人用,因为 _thread 有的 threading 都有,_thread 没有的 th 阅读全文
posted @ 2020-01-17 10:32 Rogn 阅读(946) 评论(0) 推荐(0) 编辑