摘要: scrapy中间件 1. 中间件 1.1 什么是中间件 如果有学过django的同学,应该对这个名词不陌生了,在django中,中间件可以对请求做统一批量的处理 那么在爬虫中,中间件的作用也是做批量处理的,比如把所有请求的请求头添加一个值等等等。 由于爬虫是一个发请求,获取响应的过程,所以在scra 阅读全文
posted @ 2020-07-06 22:56 Mn猿 阅读(285) 评论(0) 推荐(1) 编辑
摘要: scrapy数据持久化 爬取到的数据想要进行保存的话, 首先要对数据进行格式化话,这样数据格式统一才方便进行保存 1. 数据格式化 1.1 item.py 在我们创建的爬虫项目中item.py这个文件就是负责进行格式化数据的 # -*- coding: utf-8 -*- # Define here 阅读全文
posted @ 2020-07-06 22:42 Mn猿 阅读(178) 评论(0) 推荐(1) 编辑
摘要: scrapy过滤器 1. 过滤器 当我们在爬取网页的时候可能会遇到一个调转连接会在不同页面出现,这个时候如果我们的爬虫程序不能识别出 该链接是已经爬取过的话,就会造成一种重复不必要的爬取。所以我们要对我们即将要爬取的网页进行过滤,把重 复的网页链接过滤掉。 2. 指纹过滤器 去重处理可以避免将重复性 阅读全文
posted @ 2020-07-06 22:41 Mn猿 阅读(884) 评论(4) 推荐(0) 编辑
摘要: scrapy.Spider 这一节我们来聊一聊爬虫文件 1. 请求发送 # -*- coding: utf-8 -*- import scrapy class BaiduSpider(scrapy.Spider): name = 'baidu' allowed_domains = ['baidu.c 阅读全文
posted @ 2020-07-06 22:38 Mn猿 阅读(324) 评论(0) 推荐(0) 编辑
摘要: scrapy框架结构 1. 项目结构 1.1 认识文件 这里我们简单认识一下, 在一个scrapy爬虫项目中各个文件都是用来做什么的, 知道了这些文件是干嘛的, 那么我们来写我们的项目就会很得心应手了. 这次我们还以上次百度的那个项目为例 spider1 | |——spider1 | ├─spide 阅读全文
posted @ 2020-07-06 22:34 Mn猿 阅读(212) 评论(0) 推荐(0) 编辑
摘要: scrapy 简介&安装 初识 scrapy Scrapy是一个使用Python语言(基于Twisted(推四体的)框架,内部也就是异步非阻塞io源码)编写的开源网络爬虫框架,目前由Scrapinghub Ltd维护。Scrapy简单易用、灵活易拓展、开发社区活跃,并且是跨平台的。在Linux、 M 阅读全文
posted @ 2020-07-06 22:33 Mn猿 阅读(265) 评论(1) 推荐(0) 编辑
摘要: 第一个scrapy项目 1. 创建scrapy项目 1.1 创建项目三剑客 这里的三剑客指的是:创建项目以及运行项目的三条命令 1.1.1 创建项目 scrapy stratproject 项目名称 (base) D:\project\爬虫高性能相关>scrapy startproject spid 阅读全文
posted @ 2020-07-06 22:31 Mn猿 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 百度地图API调用 这次主要用到的是地理编码服务 1. 什么是地理编码服务 1.1 介绍 地理编码服务(又名Geocoder)是一类Web API接口服务; 地理编码服务提供将结构化地址数据(如:北京市海淀区上地十街十号)转换为对应坐标点(经纬度)功能; 地理编码服务当前未推出国际化服务,解析地址仅 阅读全文
posted @ 2020-06-13 16:54 Mn猿 阅读(2421) 评论(1) 推荐(3) 编辑
摘要: python之CSV模块 csv文件 0. csv文件介绍 csv文件格式是一种通用的电子表格和数据库导入导出格式。最近我调用RPC处理服务器数据时,经常需要将数据做个存档便使用了这一方便的格式。 python中有一个读写csv文件的包,直接import csv即可。利用这个python包可以很方便 阅读全文
posted @ 2020-05-23 16:40 Mn猿 阅读(503) 评论(0) 推荐(1) 编辑
摘要: python操作Excel openpyxl模块 0.介绍 openpyxl是一个Python库,用于读取/写入Excel 2010 xlsx / xlsm / xltx / xltm文件。 它的诞生是因为缺少可从Python本地读取/写入Office Open XML格式的库。 作为openpyx 阅读全文
posted @ 2020-05-23 16:01 Mn猿 阅读(382) 评论(1) 推荐(2) 编辑
摘要: MsSQl数据库手动注入攻击 1. MsSQl介绍 mssql又叫SQLserver数据库,是微软旗下的一款数据库产品,一般aspx和.net搭建的网站一般用的都是SQLserver数据库,公司的oa系统喜欢用这个SQLserver做后台数据库 SQLserver数据库中有三种权限 sa权限,相当于 阅读全文
posted @ 2021-12-22 23:04 Mn猿 阅读(88) 评论(0) 推荐(0) 编辑
摘要: Access数据库手工注入攻击 1. Access介绍 Access数据库是微软旗下的一种简单的数据库,功能没有mysql,sqlserver功能那么强大,一般asp网站用的就是 Access数据库,一般小公司喜欢用asp网站 数据库文件默认扩展名为.mdb,但是一般运维人员为了隐藏可能会把后缀名改 阅读全文
posted @ 2021-12-22 23:03 Mn猿 阅读(205) 评论(0) 推荐(0) 编辑
摘要: sql注入 漏洞的原理 漏洞的利用方式 漏洞的修复 1. 什么是sql [简介] sql是结构化查询语言(Structured Query Language,缩写:SQL),是一种特殊的编程语言,用于数据库中的标 准数据查询语言。1986年10月,美国国家标准学会对SQL进行规范后,以此作为关系式数 阅读全文
posted @ 2021-12-22 23:01 Mn猿 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 常见的sql注入手法 0x00. 注入点的判断 以sqlli-labs第二关为例具体讲解 变换id参数 当我们变换id参数(2+1|2-1)的时候,发现同一个页面,页面展现出不同的用户信息。也就是说,数据库中的内 容会回显到网页中来。 初步判定,id参数会带入数据库查询,根据不同的id查询数据库,得 阅读全文
posted @ 2021-12-22 23:01 Mn猿 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 天镜和Nessus的使用 1. 天镜 新建扫描任务 输入扫描的配置信息,可以自定义策略以及扫描结束发送邮件或上传FTP服务器 自定义策略 全部勾选大于常规扫描,包含了第三方应用也能扫描 主机存活探测 常规探测是采用ping探测和若干个常用tcp端口进行探测,深度探测可以绕过防火墙,也可以自定义添加端 阅读全文
posted @ 2021-12-22 23:00 Mn猿 阅读(58) 评论(0) 推荐(0) 编辑
摘要: web扫描器 1. appscan 双击安装 解压文件将指定内容替换到安装目录 基本使用 生产环境不能登录扫描,否则会产生大量垃圾数据 默认测试策略即可 启动扫描 正在扫描 生成报告 查看报告 2. AWVS 关闭打开的网页,将破解补丁替换到指定的安装目录下 简单使用 密码 : root.com12 阅读全文
posted @ 2021-12-22 22:56 Mn猿 阅读(35) 评论(0) 推荐(0) 编辑
摘要: DoS&DDoS攻防测试 dos和ddos攻击 (拒绝服务攻击) 在应急响应中经常出现 , 如果你掌握了dos和ddos攻击的话 , 在应急抓包这块 , 分析流量这块问题就不大了 , 主要讲解一下各类攻击 0x01. 什么是DoS和DDoS 1.1 DoS不是DOS 注意 : DoS不是以前的那个D 阅读全文
posted @ 2021-12-22 22:53 Mn猿 阅读(39) 评论(0) 推荐(0) 编辑
摘要: | # ARP欺骗原理分析 | | | | ## 0x01. 什么是ARP协议 | | | | > ARP协议是“Address Resolution Protocol”(地址解析协议)的缩写。 | | > | | > 工作在第二层 , 数据链路层 | | | | 在局域网中,网络中实际传输的是“帧 阅读全文
posted @ 2021-12-22 22:51 Mn猿 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 0x01. VNC提权 这些第三方软件的提权也是建立在获取webshell的基础上 1.1 环境部署 双击安装vnc 搭建环境的话 , vnc服务端和客户端都安装一下 安装完成点击确定 , 设置连接密码 : 123456 打开注册机 , 获取key : R8NLH-CQW8E-QMA7E-VQ3VQ 阅读全文
posted @ 2021-12-22 22:48 Mn猿 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 服务器一般都会装一些管理软件 , 我们可以尝试通过这些服务器软件进行提权 0x01. Serv-u安全性测试 1.1 Serv-u的安装 双击安装 然后就是下一步下一步安装了 默认安装路径 : C:\Program Files\RhinoSoft.com\Serv-U 安装补丁 因为这个软件默认是收 阅读全文
posted @ 2021-12-22 22:47 Mn猿 阅读(154) 评论(0) 推荐(0) 编辑