爬虫高级__JS逆向__App逆向 - 随笔分类 - Edmond辉仔

07--JS07--逆向03：字体反爬、JS反调试破解

摘要：JS逆向03：字体反爬、JS反调试破解 jsvmp : 代码虚拟化保护方案 ast : 抽象语法树 1.字体文件、字体反爬 ### 1 字体文件 .ttf .woff 或 .eot 在计算机内存中，文字就是一堆二进制(unicode)，要以文字图形的样子，展示给用户看就要指定它们之间的对应关系，阅读全文

posted @ 2024-07-12 15:30 Edmond辉仔阅读(384) 评论(0) 推荐(0)

06--JS06--逆向02：重现JS代码、加密逻辑、逆向经验

摘要：JS逆向02：重现JS代码、加密逻辑、逆向经验一、JS逆向方案二：重现JS # 重现JS代码根据JS代码的逻辑，用python代码，一步步将JS代码逻辑还原改换成我们自己的代码，实现JS代码同样的功能 # 缺点：在加解密上，仅限于通用的加密、解密，可以使用python重现逻辑但若是网站自阅读全文

posted @ 2024-05-21 01:32 Edmond辉仔阅读(373) 评论(0) 推荐(0)

05--JS05--逆向01：抓包工具、PyExecjs模块、扣JS代码

摘要：JS逆向01：浏览器工具、抓包工具、PyExeJs模块、扣JS代码 # 逆向的关键点：加密或解密的入口一、浏览器工具 1.1 显示请求协议 # protocal n.协议 # http协议的版本： http/1.1 、h2 # 大多数网站是两者协议兼容，极少数的网站会检测http协议的版本阅读全文

posted @ 2024-05-21 01:28 Edmond辉仔阅读(562) 评论(0) 推荐(0)

04--JS04--进阶：jsonp、promise、axios、xml.open

摘要：JavaScript04：拓展进阶一. jsonp # 0 前提：浏览器同源策略限制跨域浏览器的同源策略，浏览器的基本安全策略不允许去不同的url地址获取数据，即域名、端口、协议必须相同 # 请求访问实质是可以的，只是返回的数据被浏览器拦截，不接受而已 # 1 访问服务器的目的 1.加载图片阅读全文

posted @ 2024-05-20 01:49 Edmond辉仔阅读(156) 评论(0) 推荐(0)

03--JS03--JQuery、Ajax

摘要：JavaScript03：jQuery与Ajax jQuery是一个曾经火遍大江南北的一个Javascript的第三方库，现在前端使用很少了，但依旧有很多网站是用这个写的，只需要读得懂 jQuery的理念: write less do more. 其含义就是让前端程序员从繁琐的js代码中解脱出来. 阅读全文

posted @ 2024-05-16 23:34 Edmond辉仔阅读(55) 评论(0) 推荐(0)

02--JS02--高级

摘要：JavaScript02: 高级进阶一. 变量声明 1.1 变量提升 // 以下代码，或多或少会有些问题的 function fn(){ console.log(name); var name = '大马猴'; } fn() // 问题: name变量先使用，再定义这么写代码，在其他语言里. 绝阅读全文

posted @ 2024-05-14 01:11 Edmond辉仔阅读(86) 评论(0) 推荐(0)

01--JS01--入门

摘要：JavaScript01: 基础入门 JavaScript 是一门能够运行在浏览器上的脚本语言，简称JS。首先，Javascript这个名字的由来就很有意思，不少人认为 Javascript 和 Java 貌似很像，容易想象成Java的脚本但其实两者之间没有任何关系，纯粹是商业碰瓷。既然JS是阅读全文

posted @ 2024-05-09 18:36 Edmond辉仔阅读(107) 评论(0) 推荐(0)

案例02--scrapy综合练习--中大网校

摘要：一抓取需求 # 抓取需求 start_url = 'http://ks.wangxiao.cn/' 抓取首页各分类下 > 各种考试 > 考点练习里各科目的练习题 eg：工程类 > 一级建造师 > 建设工程经济 >章节 # 存储需求: 文件存储题目中可能包含图片 md格式比较合适按照分阅读全文

posted @ 2024-05-08 23:11 Edmond辉仔阅读(69) 评论(0) 推荐(0)

19--Scarpy05:增量式爬虫、分布式爬虫

摘要：Scarpy05--增量式爬虫、分布式爬虫一. 增量式爬虫顾名思义：可以对网站进行反复抓取，然后发现新东西了就保存起来，遇到了以前抓取过的内容就自动过滤掉即可其核心思想：去重，并且可以反复去重。随时运行一下，将不同的数据保存出来，相同的数据去除掉(不保存)即可增量爬虫的核心：去除重复去除u 阅读全文

posted @ 2024-04-25 01:01 Edmond辉仔阅读(180) 评论(0) 推荐(0)

18--Scrapy04:CrawlSpider、链接提取器、源码模板文件

摘要：Scrapy04--CrawlSpider、链接提取器、源码模板文件案例：汽车之家，全站抓取二手车的信息来区分Spider 和 CrawlSpider 注意：汽车之家的访问频率要控制一下，要不然会跳验证 settings.py 中设置 DOWNLOAD_DELAY = 3 一、常规Spide 阅读全文

posted @ 2024-04-24 15:53 Edmond辉仔阅读(62) 评论(0) 推荐(0)

17--Scrapy03:分页、模拟登录与中间件

摘要：Scrapy03--分页、处理cookie与中间件一、分页(多页)抓取思路 ### 不涉及scrapy，所有网站分页的抓取思路 ### 1.正常的普通分页分页表现: 上一页 1,2,3,4,5,6 下一页 # 情况1: 页面源代码中有分页的url 解决方案: 1.访问第一页 > 提取下一页的阅读全文

posted @ 2024-04-18 01:25 Edmond辉仔阅读(264) 评论(0) 推荐(0)

16--Scrapy02:管道

摘要：Scrapy02--管道 0. 关于管道上一节内容,我们已经可以从spider中提取到数据. 然后通过引擎将数据传递给pipeline 那么在pipeline中如何对数据进行保存呢? 主要针对四种数据存储,展开讲解前三个案例以：https://match.lottery.sina.com.cn/ 阅读全文

posted @ 2024-04-17 00:49 Edmond辉仔阅读(265) 评论(0) 推荐(0)

15--Scrapy01:介绍与初步使用

摘要：Scrapy01--基本介绍与初步使用一、爬虫工程化何为工程化，就是让你的程序更加的有体系，有逻辑，更加的模块化. 到目前为止，我们所编写的爬虫我们都是从头到尾的每一步都要亲力亲为. 这样做固然有其优点(可控性更好)，但是各位请认真思考. 这样的代码逻辑是不能形成批量生产的效果的(写100个爬虫阅读全文

posted @ 2024-04-15 16:34 Edmond辉仔阅读(79) 评论(0) 推荐(0)

14--爬虫回顾和重点经验

摘要：01.浏览器 # 一个网页的加载全过程 1. 服务器端渲染 html的内容和数据在服务器进行融合. 在浏览器端看到的页面源代码中. 有你需要的数据 2. 客户端(浏览器)渲染 html的内容和数据进行融合是发生在你的浏览器上的. 这个过程一般通过脚本来完成(javascript) 我们通过浏览器可以阅读全文

posted @ 2024-04-11 16:54 Edmond辉仔阅读(89) 评论(0) 推荐(0)

13--selenium回顾

摘要：一前期准备 1.1 概述 selenium本身是一个自动化测试工具。它可以让python代码调用浏览器，并获取到浏览器中加载的各种资源。我们可以利用selenium提供的各项功能，帮助我们完成数据的抓取 1.2 学习目标掌握 selenium发送请求，加载网页的方法掌握 selenium简阅读全文

posted @ 2024-01-19 23:20 Edmond辉仔阅读(79) 评论(0) 推荐(0)

案例01--抓取每日影视的m3u8视频

摘要：案例：抓取每日影视的m3u8视频 1 思路分析练习：抓取每日影视首页/域名 https://sp.weoknow.com/ 无耻之徒视频页：https://sp.weoknow.com/index.php/vod/play/id/28124/sid/1/nid/1.html # 分析 0：获得阅读全文

posted @ 2024-01-16 00:41 Edmond辉仔阅读(11493) 评论(0) 推荐(0)

爬虫--抓取m3u8类型的视频

摘要：抓取m3u8类型的视频 1 思路步骤视频url：https://www.9meiju.cc/mohuankehuan/shandianxiadibaji/1-1.html 打开网址分析当前视频是由多个片段组成还是单独一个视频如果是一个单独视频，则找到网址，直接下载即可如果为多个片段的视频，则需阅读全文

posted @ 2024-01-16 00:39 Edmond辉仔阅读(1979) 评论(0) 推荐(0)

12--协程

摘要：一协程概念 # 1 协程又称微线程(纤程)，是一种用户态的轻量级线程 # 2 子程序在所有的语言中都是层级调用的比如A中调用B，B在执行过程中调用C C执行完返回，B执行完返回，最后是A执行完毕这是通过栈实现的，一个函数就是一个执行的子程序子程序的调用总是有一个入口、一次返回，调用的顺序阅读全文

posted @ 2024-01-08 23:06 Edmond辉仔阅读(71) 评论(0) 推荐(0)

11--多线程回顾

摘要：一线程 1.1 概念线程在一个进程的内部，要同时干多件事，就需要同时运行多个“子任务”，把进程内的这些“子任务”叫做线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中，是进程中的实际运作单位一条线程指的是进程中一个单一顺序的控制流，一个进程中可以并发多个线程，每条线程并行执行不同阅读全文

posted @ 2024-01-08 22:56 Edmond辉仔阅读(119) 评论(0) 推荐(0)

10--多进程回顾

摘要：一多任务原理 1.1 概念现代操作系统比如Mac OS X，UNIX，Linux，Windows等，都是支持“多任务”的操作系统就是操作系统可以同时运行多个任务 1.2 实现原理单核CPU实现多任务原理操作系统轮流让各个任务交替执行 QQ执行2us（微秒），切换到微信，在执行2us，再切换阅读全文

posted @ 2024-01-08 20:34 Edmond辉仔阅读(83) 评论(0) 推荐(0)

Edmond辉仔

随笔分类 - 爬虫高级JS逆向App逆向

公告

Edmond辉仔

随笔分类 - 爬虫高级__JS逆向__App逆向

公告

随笔分类 - 爬虫高级JS逆向App逆向