该文被密码保护。 阅读全文
posted @ 2023-11-12 17:05
毓见
阅读(1)
评论(0)
推荐(0)
摘要:
1 scrapy解析数据 🧉 ##### 运行爬虫 scrapy crawl cnblogs ##### 可以项目目录下写个main.py from scrapy.cmdline import execute execute(['scrapy','crawl','cnblogs','--nolog 阅读全文
1 scrapy解析数据 🧉 ##### 运行爬虫 scrapy crawl cnblogs ##### 可以项目目录下写个main.py from scrapy.cmdline import execute execute(['scrapy','crawl','cnblogs','--nolog 阅读全文
posted @ 2023-11-12 16:08
毓见
阅读(75)
评论(0)
推荐(0)

1 打码平台🌴 # 1 登录某些网站,会有验证码 》想自动破解 -数字字母:python模块:ddddocr -计算题,成语题,滑块。。。:第三方打码平台,人工操作 # 2 打码平台 -云打码,超级鹰 # 3 咱们破解网站登录的思路 -使用selenium 》打开网站 》(不能解析出验证码地址)
1 selenium等待元素加载🍧 # 程序执行速度很快 》获取标签 》标签还没加载好 》直接去拿会报错 # 显示等待:当你要找一个标签的时候,给它加单独加等待时间 # 隐士等待:只要写一行,代码中查找标签,如果标签没加载好,会自动等待 browser.implicitly_wait(10) 2
1 搜索文档树🥨 # 1 find_all :找所有 列表 # 2 find 找一个 Tag类的对象 1.1 find和find_all from bs4 import BeautifulSoup html_doc = """ <html><head><title>The Dormouse's s
1 代理池搭建🍟 # ip代理 -每个设备都会有自己的IP地址 -电脑有ip地址 》访问一个网站 》访问太频繁 》封ip -收费:靠谱稳定--提供api -免费:不稳定--自己写api用 -开源的:https://github.com/jhao104/proxy_pool 免费代理 》爬取免费代理
1 爬虫介绍👧🏻 # 爬虫是什么? -网页蜘蛛,网络机器人,spider -在互联网中 通过 程序 自动的抓取数据 的过程 -根上:使用程序 模拟发送http请求 》得到http响应 》把响应的数据解析出来 》存储起来 # 做爬虫需要掌握的技术 -web端爬虫(网页) -抓包: -抓包工具 》浏
1 redis其它操作💜 ''' delete(*names) exists(name) keys(pattern='*') expire(name ,time) rename(src, dst) move(name, db)) randomkey() type(name) ''' # redis
1 redis普通连接和连接池 🌷 #1 python 代码作为客户端 》连接 # 2 安装模块:pip install redis 1.1普通连接 from redis import Redis conn = Redis(host="localhost",port=6379,db=0,decod
1 注册功能🍰 # 分析 前端:携带数据格式 {mobile:,code:,password} 后端: -1 视图类 》注册方法 -2 序列化类 》校验,保存(表中字段多,传的少 》随机,按某种格式生成 》后期修改) 视图类 class UserRegisterView(GenericViewSe
浙公网安备 33010602011771号