05 2020 档案

摘要:1. pyquery 1.1 介绍 Jquery解析库 "官网" https://pythonhosted.org/pyquery/ 1.2 安装 pip install pyquery 1.3 使用方式 1.3.1 初始化方式 字符串 url 文件 1.3.2 选择节点 获取当前节点 获取子节点 阅读全文
posted @ 2020-05-24 23:42 |Thresh| 阅读(564) 评论(0) 推荐(0)
摘要:1. JSON与JsonPATH JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景,比如网站前台与后台之间的数据交互。 JSON和XML的比较可谓不相上下。 Pyt 阅读全文
posted @ 2020-05-24 23:40 |Thresh| 阅读(339) 评论(0) 推荐(0)
摘要:1. 介绍 之前 BeautifulSoup 的用法,这个已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法。如果大家对 BeautifulSoup 使用不太习惯的话,可以尝试下 Xpath "官网" http://lxml.d 阅读全文
posted @ 2020-05-24 23:37 |Thresh| 阅读(633) 评论(0) 推荐(0)
摘要:1. Beautiful Soup的简介 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful Soup自动将输入文档 阅读全文
posted @ 2020-05-24 23:35 |Thresh| 阅读(480) 评论(0) 推荐(0)
摘要:1. 提取数据 使用正则表达式提取数据 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Pyth 阅读全文
posted @ 2020-05-24 23:32 |Thresh| 阅读(426) 评论(0) 推荐(0)
摘要:1. 介绍 对了解一些爬虫的基本理念,掌握爬虫爬取的流程有所帮助。入门之后,需要学习一些更加高级的内容和工具来方便我们的爬取。 关于requests 库的基本用法。 2. 安装 利用 pip 安装 3. 基本请求 3.1 get请求 参数是字典,我们也可以传递json类型的参数: 3.2 post请 阅读全文
posted @ 2020-05-18 10:11 |Thresh| 阅读(202) 评论(0) 推荐(0)
摘要:1. Cookie 为什么要使用Cookie呢? Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密) 比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以利用Urllib库保存我们登录的Cooki 阅读全文
posted @ 2020-05-18 10:04 |Thresh| 阅读(223) 评论(0) 推荐(0)
摘要:1. 伪装自己 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作 1.1 设置请求头 其中 代表用的哪个请求的浏览器 代码如下: 对付防盗链,服务器会识别headers中的referer是不是它自己,如果不是,有的服务器不会响应,所以我 阅读全文
posted @ 2020-05-18 09:56 |Thresh| 阅读(201) 评论(0) 推荐(1)
摘要:1. 小试牛刀 怎样扒网页呢? 其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以最重要的部分是存 阅读全文
posted @ 2020-05-18 09:53 |Thresh| 阅读(383) 评论(0) 推荐(0)
摘要: 1. 常用的工具 1. python 2. pycharm 3. 浏览器 1. chrome 2. 火狐 4. fiddler 2 fiddler的使用 2.1 操作界面 2.2 界面含义 请求 (Request) 部分详解 | 名称 | 含义 | | | | | Headers | 显示客户端 阅读全文
posted @ 2020-05-17 22:20 |Thresh| 阅读(234) 评论(0) 推荐(0)
摘要:1. 什么是爬虫? 网络爬虫 也叫 网络蜘蛛 ,如果把互联网比喻成一个蜘蛛网,那么蜘蛛就是在网上爬来爬去的蜘蛛,爬虫程序通过请求url地址,根据响应的内容进行解析采集数据, 比如:如果响应内容是html,分析dom结构,进行dom解析、或者正则匹配,如果响应内容是xml/json数据,就可以转数据对 阅读全文
posted @ 2020-05-17 21:43 |Thresh| 阅读(442) 评论(0) 推荐(1)
摘要:永恒之蓝漏洞的利用测试 一、 环境及工具 系统环境:虚拟机Kali Linux 2、Windows 7 网络环境:交换网络结构 实验工具: Metasploit、Nmap IP地址:Kali-Linux 2:192.168.0.104;Windows 7 :192.168.0.101 二、操作步骤 阅读全文
posted @ 2020-05-17 21:24 |Thresh| 阅读(1678) 评论(0) 推荐(0)
摘要:​ 一、漏洞渗透测试 1、靶机安装easy file sharing server(efssetup_2018.zip) 2、利用Nmap扫描发现靶机(Windows)运行了该服务。P99-100 3、利用该漏洞,使得靶机运行计算器。P116-119 具体实现过程: 使用namp扫描目标计算机: 阅读全文
posted @ 2020-05-17 21:23 |Thresh| 阅读(965) 评论(0) 推荐(0)
摘要:通过使用cknife,菜刀,冰蝎三种WebShell,使用wireshark抓包分析数据,了解这三者的工作原理。 菜刀使用 通过在靶机上挂马,使用菜刀连接靶机 获得靶机网站管理 写入一个文件 然后用wireshark抓包分析通信流量看看 通信端口在80,以http post通讯 追踪流 红色部分即 阅读全文
posted @ 2020-05-17 21:19 |Thresh| 阅读(2420) 评论(0) 推荐(1)
摘要:python处理word和excel表格数据 学习过程中遇到批量将excel表格数据填入到word的问题,对于excel的函数使用不是很熟悉,python中有处理word和excel的库,所以学习使用python实现对数据的批量处理。首先是需要了解处理word和excel的具体操作。 python对 阅读全文
posted @ 2020-05-17 20:59 |Thresh| 阅读(2483) 评论(0) 推荐(0)
摘要:2.1在列表,字典,集合中根据条件筛选数据 1.过滤列表中的负数 通常使用迭代 from random import randintdata=data=[randint(-10,10) for _ in range(10)]res=[]for x in data: if x>=0: res.appe 阅读全文
posted @ 2020-05-13 23:47 |Thresh| 阅读(525) 评论(0) 推荐(0)
摘要:2020年蓝桥杯省赛模拟赛-python题解 题目1 问题描述 一个包含有2019个结点的无向连通图,最少包含多少条边? 答案提交 这是一道结果填空的题,你只需要算出结果后提交即可。本题的结果为一个整数,在提交答案时只填写这个整数,填写多余的内容将无法得分。 答案 :2018 题目2 问题描述 将L 阅读全文
posted @ 2020-05-13 17:43 |Thresh| 阅读(8302) 评论(0) 推荐(4)