会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Dream-Z
Hope Your Life Is Worth It !
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
93
94
95
96
97
98
下一页
2023年2月25日
Day 24 24.1:逆向分析1 - Steam案例
摘要: STEAM逆向分析 url:https://store.steampowered.com/login/?redir=&redir_ssl=1 分析思路: 输入用户名和密码后,点击登录按钮,通过抓包工具捕获点击登录按钮后发起请求对应的相关数据包。 定位了登录的数据包: 发现只有密码是加密的,因此需要对
阅读全文
posted @ 2023-02-25 10:34 Chimengmeng
阅读(148)
评论(0)
推荐(0)
2023年2月24日
Day 23 23.2.1:微信公众平台案例
摘要: 微信公众平台案例 注意:接下来将的内容,请忽视具体网站,重点专注逆向的分析思路! 接下来就是爬什么网站,什么数据,什么形式都统统不重要!重点是分析思路 微信公众平台案例 url:https://mp.weixin.qq.com 分析思路: 先通过抓包工具发现,密码是经过加密,并且发现密码的加密后的数
阅读全文
posted @ 2023-02-24 21:33 Chimengmeng
阅读(47)
评论(0)
推荐(0)
Day 23 23.2:逆向前期准备
摘要: 逆向前期准备 环境安装 pip install PyExecJS(自己pip安装,安装成功后,最好重启下cmd终端和pycharm,或者重启电脑) 安装node.js开发环境:安装好了之后,记得重启电脑! js改写工具 PyExecJS介绍 PyExecJS 是一个可以使用 Python 来模拟运行
阅读全文
posted @ 2023-02-24 21:31 Chimengmeng
阅读(57)
评论(0)
推荐(0)
Day 23 23.1:js加密算法
摘要: js加密算法 逆向重点掌握的内容: 1.逆向的思维 2.网站逆向的分析思路和步骤 注意:重点不是放在代码中,而是分析的思路和套路(技巧) 逆向到底是什么? 通俗来讲,逆向就是处理爬虫过程中对于加密数据的破解,和一些动态变化请求参数的处理。 js常见的加密方式 加密在前端开发和爬虫中是经常遇见的。掌握
阅读全文
posted @ 2023-02-24 20:15 Chimengmeng
阅读(113)
评论(0)
推荐(1)
Day 22 22.3:生产者和消费者模式
摘要: 生产者消费者模式 认识生产者和消费者模式 生产者和消费者是异步爬虫中很常见的一个问题。产生数据的模块,我们称之为生产者,而处理数据的模块,就称为消费者。 例如:  图片数据爬取中,解析出图片链接的操作就是在生产数据  对图片链接发起请求下载图片的操作就是在消费数据 为什么要使用生产者和消费者模式
阅读全文
posted @ 2023-02-24 16:47 Chimengmeng
阅读(36)
评论(0)
推荐(0)
Day 11 11.2 文件操作
摘要: 文件操作 引言 到目前为止,我们做的一切操作,都是在内存里进行的,这样会有什么问题吗?如果一旦断电或发生意外关机了,那么你辛勤的工作成果将瞬间消失。是不是感觉事还挺大的呢?现在你是否感觉你的编程技巧还缺了点什么呢?是的,我们还缺少将数据在本地文件系统进行持久化的能力,白话讲就是文件的读写能力。 文件
阅读全文
posted @ 2023-02-24 12:57 Chimengmeng
阅读(34)
评论(0)
推荐(0)
Day 11 11.1 Xpath解析
摘要: xpath解析 xpath在Python的爬虫学习中,起着举足轻重的地位,对比正则表达式 re两者可以完成同样的工作,实现的功能也差不多,但xpath明显比re具有优势,在网页分析上使re退居二线。 xpath 全称为XML Path Language 一种小型的查询语言 xpath的优点: 可在X
阅读全文
posted @ 2023-02-24 12:57 Chimengmeng
阅读(136)
评论(0)
推荐(0)
Day 22 22.2:scrapy部署
摘要: scrapy项目部署 scrapyd部署工具介绍 scrapyd是一个用于部署和运行scrapy爬虫的程序,它由 scrapy 官方提供的。它允许你通过JSON API来部署爬虫项目和控制爬虫运行。 所谓json api本质就是post请求的webapi 选择一台主机当做服务器,安装并启动 scra
阅读全文
posted @ 2023-02-24 09:17 Chimengmeng
阅读(72)
评论(0)
推荐(0)
2023年2月22日
Day 22 22.1.2:增量式爬虫 - 场景2的实现
摘要: 场景2的实现: 数据指纹 使用详情页的url充当数据指纹即可。 创建爬虫爬虫文件: cd project_name(进入项目目录) scrapy genspider 爬虫文件的名称(自定义一个名字即可) 起始url (例如:scrapy genspider first www.xxx.com) 创建
阅读全文
posted @ 2023-02-22 16:21 Chimengmeng
阅读(31)
评论(0)
推荐(0)
Day 22 22.1.1:增量式爬虫 - 场景1的实现
摘要: 场景1的实现: 数据指纹: 数据的唯一标识。记录表中可以不直接存储数据本身,直接存储数据指纹更好一些。 创建爬虫爬虫文件: cd project_name(进入项目目录) scrapy genspider 爬虫文件的名称(自定义一个名字即可) 起始url (例如:scrapy genspider f
阅读全文
posted @ 2023-02-22 15:18 Chimengmeng
阅读(64)
评论(0)
推荐(0)
上一页
1
···
93
94
95
96
97
98
下一页
公告