摘要: ‘ 爬虫高阶 一、 验证码识别 1、 简介 验证码和爬虫之间的爱恨情仇? 反爬机制:验证码,识别验证码图片中的数据,用于登录验证 识别验证码的操作: 人工肉眼识别(不推荐) 第三方自动识别 打码平台:超级鹰 2、 使用方法 注册 登录 下载开发者文档:【http://www.chaojiying.c 阅读全文
posted @ 2022-03-02 21:48 Kenny_LZK 阅读(278) 评论(0) 推荐(0)
摘要: 高性能异步编程 一、 引入背景 1、 概述 其实爬虫的本质就是client发请求批量获取server的响应数据,如果我们有多个url待爬取,只用一个线程且采用串行的方式执行,那只能等待爬取一个结束后才能继续下一个,效率会非常低。需要强调的是:对于单线程下串行N个任务,并不完全等同于低效,如果这N个任 阅读全文
posted @ 2022-03-02 10:11 Kenny_LZK 阅读(356) 评论(0) 推荐(1)