随笔分类 -  Python3网络爬虫

摘要:POST方法向网站发送数据 server.py import flask app = flask.Flask(__name__) @app.route('/', methods=['GET','POST']) def index(): try: province = flask.request.fo 阅读全文
posted @ 2024-05-18 20:02 JJJhr 阅读(144) 评论(0) 推荐(0)
摘要:使用GET方法访问网站 服务器接收get参数 server.py import flask app = flask.Flask(__name__) @app.route('/') def index(): province = flask.request.args.get('province') c 阅读全文
posted @ 2024-05-18 19:49 JJJhr 阅读(47) 评论(0) 推荐(0)
摘要:网站模拟登陆的滑块验证码识别 session和cookie自动登录机制 HTTP 协议本身是一种 "无状态" 协议。服务器接收到浏览器的请求后,不管是谁请求的,服务器直接返回内容给浏览器。也就是说默认情况下 HTTP 协议的客户端和服务器之间的一次通信和下一次通信之间是没有直接的联系 Cookie机 阅读全文
posted @ 2024-05-09 01:49 JJJhr 阅读(118) 评论(0) 推荐(0)
摘要:scrapy爬取知名问答网站 分析及数据表设计 itemloader方式提取question spider爬虫逻辑的实现以及answer的提取 保存数据到mysql中 阅读全文
posted @ 2024-05-07 17:11 JJJhr 阅读(17) 评论(0) 推荐(0)
摘要:通过windows服务管理器启动MySQL服务 1 开始-->运行-->输入services.msc命令-->启动MySQL服务 通过DOS命令启动MySQL服务 1 net start mysql 停止MySQL服务 通过windows服务管理器启动MySQL服务 1 开始-->运行-->输入se 阅读全文
posted @ 2024-04-30 01:35 JJJhr 阅读(22) 评论(0) 推荐(0)
摘要:scrapy安装以及目录结构介绍 创建有python3的虚拟环境 mkvirtualenv mkvirtualenv py3env 安装scrapy 进入虚拟环境py3env,把pip的源设置为豆瓣源。这个命令执行完毕后,以后使用pip安装Python包时就会从豆瓣源下载,速度会更快 pip con 阅读全文
posted @ 2024-04-21 16:15 JJJhr 阅读(166) 评论(0) 推荐(0)