随笔分类 -  逆向工程

web端与app端的逆向
js逆向--反爬介绍(1)
摘要:一.介绍: 近几年大数据的发展,各个公司的数据保护意识越来越强,随着前端技术的发展,前端代码的打包技术,混淆技术,加密技术层出不穷,使各公司可以在前端对js代码采取一定的保护,比如变量名混淆,执行逻辑混淆,反调试,核心逻辑加密等,使得我们没法轻易地找出js代码中包含的执行逻辑。 对于反爬网站复杂的, 阅读全文

posted @ 2023-07-11 17:54 花阴偷移 阅读(636) 评论(0) 推荐(0)

curl 用法以及验证代理ip
摘要:说明: 1)在程序中,使用代理ip请求目标网站时,有的网站会返回403或其它错误,这时可以通过命令方式来验证代理ip是否可用。 在linux中,使用curl ,下面使用阿布云代理ip请求目标网站,来确认是否能正确响应数据 curl -x "http://http-dyn.abuyun.com:902 阅读全文

posted @ 2023-06-20 11:08 花阴偷移 阅读(234) 评论(0) 推荐(0)

使用cmd 执行scrapy命令
摘要:说明: 在使用scrapy的playwright爬取时,需要打开浏览器才能抓取到,所有要部署到windows环境中,在win服务器中安装配置好python环境后,把scrapy项目的源码复制到服务器目录中,这里服务器项目的目录是:C:\python-project\ebs-python-crawle 阅读全文

posted @ 2023-04-06 10:15 花阴偷移 阅读(43) 评论(0) 推荐(0)

Scrapy 响应乱码
该文被密码保护。

posted @ 2023-02-28 18:17 花阴偷移 阅读(0) 评论(0) 推荐(0)

scrapyrt 部署到docker
摘要:一.背景 scrapyrt是实时抓取api框架,我们生产环境一直使用默认的python 3.6.8环境,来部署的scrapyrt。但由于自动化抓取playwright至少需要python 3.7以上,又因为阿里云centos 8默认的python 3.6.8升级后带来很多不便,现在需要将scrapy 阅读全文

posted @ 2022-12-28 10:57 花阴偷移 阅读(190) 评论(0) 推荐(0)

scrapy 安装报错 This package requires Rust >=1.48.0.
摘要:在pip3 install scrapy==2.5.1 安装包时报错,提示:This package requires Rust >=1.48.0. 解决方案:更新pip3包,命令如下: pip3 install --upgrade pip 阅读全文

posted @ 2022-12-26 12:20 花阴偷移 阅读(3046) 评论(0) 推荐(0)

scrapy 监控可视化Grafana介绍与安装(2)
摘要:一.概述 Grafana是一个用于监控和可观察性的开源平台。它提供了查询、可视化、提醒、和了解指标,它专注于时序类图表分析,而且支持多种数据源,如Prometheus、Graphite、InfluxDB、Elasticsearch、MySQL、Kubernetes、Zabbix等。 Grafana对 阅读全文

posted @ 2022-12-26 12:20 花阴偷移 阅读(76) 评论(0) 推荐(0)

Airtest介绍
该文被密码保护。

posted @ 2022-12-26 12:19 花阴偷移 阅读(0) 评论(0) 推荐(0)

Splash Lua 脚本介绍
该文被密码保护。

posted @ 2022-12-26 12:18 花阴偷移 阅读(0) 评论(0) 推荐(0)

scrapyd-client安装和部署项目介绍
摘要:1.介绍 前面讲解了如何在服务端安装scrapyd,本篇讲客户端scrapyd-client安装部署介绍。 scrapyd-client是scrapyd的客户端,它提供了: 1) scrapyd-deploy, 将scrapy项目部署到 Scrapyd 服务器。 2)scrapyd-client, 阅读全文

posted @ 2022-12-26 12:17 花阴偷移 阅读(112) 评论(0) 推荐(0)

python Setuptools安装打包(windows)
摘要:1.介绍 Setuptools 是一个功能齐全、积极维护且稳定的库,旨在促进 Python 项目的打包。由于开发环境使用的是windows+vs code,这里的工具安装包括,都是在windows上进行。 1)安装 #打开cmdm,使用pip安装最新版本 pip install --upgrade 阅读全文

posted @ 2022-12-26 12:16 花阴偷移 阅读(333) 评论(0) 推荐(0)

Scrapy Settings 内置设置参考
摘要:在settings.py文件中,有内置的设置,按字母顺序排列,以及它们的默认值和它们的应用范围,本篇列出一些常用的内置设置。 BOT_NAME 项目名称,此名称也用于日志记录,默认: scrapybot CONCURRENT_ITEMS 设置item pipeline同时(并发)处理每个respos 阅读全文

posted @ 2022-12-26 12:16 花阴偷移 阅读(97) 评论(0) 推荐(0)

Scrapy Settings(设置)概述
摘要:1.介绍 Settings.py文件允许自定义所有Scrapy组件的行为,包括core,extensions,pipelines,spiders本身。 Settings的基础结构提供了键值映射的全局命名空间,可以在代码中使用该命名空间从中提取配置值。 2. 填充Settings 可以使用不同的机制填 阅读全文

posted @ 2022-12-26 12:15 花阴偷移 阅读(49) 评论(0) 推荐(0)

Scrapy-Splash中使用render.html 接口详述
该文被密码保护。

posted @ 2022-12-26 12:13 花阴偷移 阅读(0) 评论(0) 推荐(0)

Scrapy-Splash 接口概述
该文被密码保护。

posted @ 2022-12-26 12:12 花阴偷移 阅读(0) 评论(0) 推荐(0)

Scrapy items 项目
摘要:1.items 抓取的主要目标是从非结构化来源(通常是网页)中提取结构化数据. spider可以将提取的数据返回为items,即定义键值对的 Python 对象。 scrapy支持多种类型的items。 scrapy通过itemadapter库支持以下类型的item: 字典(dictionaries 阅读全文

posted @ 2022-12-26 12:12 花阴偷移 阅读(26) 评论(0) 推荐(0)

Scrapy Selectors 选择器
摘要:1.介绍 当抓取网页时,需要执行最常见的任务是从html源中提取数据,有几个库可以实现这一点,例如: 1)BeautifulSoup是python程序员中非常流行的web抓取库,能很好地处理不良标记,但速度慢. 2)lxml是一个xml解析库(也解析html),lxml不是python标准库的一部分 阅读全文

posted @ 2022-12-26 12:12 花阴偷移 阅读(38) 评论(0) 推荐(0)

Scrapy Spider类介绍
摘要:一.介绍 Spider是定义如何抓取某一个站点(或一组站点的类),包括如何执行Crawl,以及如何从其页面中提取结构化数据。 对于spider,抓取周期是这样的: 1)首先生成初始请求以抓取第一个 URL,并指定一个回调函数以使用从这些请求下载的响应调用。 第一个要执行的请求是通过调用start_r 阅读全文

posted @ 2022-12-26 12:11 花阴偷移 阅读(56) 评论(0) 推荐(0)

Scrapy 命令行工具
摘要:1.Scrapy是通过 scrapy命令行工具控制的,Scrapy 工具提供了多个命令,用于多种用途,每个命令都接受一组不同的参数和选项。 2.配置设置 scrapy.cfg 文件位置: 1)系统级的位置:我这里是在D:\Users\AndyH\AppData\Local\Programs\Pyth 阅读全文

posted @ 2022-12-26 12:10 花阴偷移 阅读(104) 评论(0) 推荐(0)

Scrapy 第一个示例
摘要:前置条件 安装python3.6 + 安装vs code scrapy 包安装 pip3 install scrapy 一.打开vs code ,在终端输入命令, Scrapy创建项目,这样项目就创建在F:\python_work\scrapy_Sample\tutorial 文件夹中 PS F:\ 阅读全文

posted @ 2022-12-26 12:09 花阴偷移 阅读(11) 评论(0) 推荐(0)

导航