随笔档案「2020年5月」 - ｜Thresh｜

python爬虫学习笔记(十一)-数据提取之PyQuery的使用

摘要：1. pyquery 1.1 介绍 Jquery解析库 "官网" https://pythonhosted.org/pyquery/ 1.2 安装 pip install pyquery 1.3 使用方式 1.3.1 初始化方式字符串 url 文件 1.3.2 选择节点获取当前节点获取子节点阅读全文

posted @ 2020-05-24 23:42 ｜Thresh｜阅读(575) 评论(0) 推荐(0)

python爬虫学习笔记(十)-数据提取之JsonPath的使用

摘要：1. JSON与JsonPATH JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式，它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景，比如网站前台与后台之间的数据交互。 JSON和XML的比较可谓不相上下。 Pyt 阅读全文

posted @ 2020-05-24 23:40 ｜Thresh｜阅读(345) 评论(0) 推荐(0)

python爬虫学习笔记(九)-数据提取之XPath的使用

摘要：1. 介绍之前 BeautifulSoup 的用法，这个已经是非常强大的库了，不过还有一些比较流行的解析库，例如 lxml，使用的是 Xpath 语法，同样是效率比较高的解析方法。如果大家对 BeautifulSoup 使用不太习惯的话，可以尝试下 Xpath "官网" http://lxml.d 阅读全文

posted @ 2020-05-24 23:37 ｜Thresh｜阅读(645) 评论(0) 推荐(0)

python爬虫学习笔记(八)-数据提取之Beautiful Soup的使用

摘要：1. Beautiful Soup的简介 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。 Beautiful Soup自动将输入文档阅读全文

posted @ 2020-05-24 23:35 ｜Thresh｜阅读(484) 评论(0) 推荐(0)

python爬虫学习笔记(七)-数据提取之正则表达式

摘要：1. 提取数据使用正则表达式提取数据正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是用来匹配字符串非常强大的工具，在其他编程语言中同样有正则表达式的概念，Pyth 阅读全文

posted @ 2020-05-24 23:32 ｜Thresh｜阅读(448) 评论(0) 推荐(0)

python爬虫学习笔记(六)-Request库的用法

摘要：1. 介绍对了解一些爬虫的基本理念，掌握爬虫爬取的流程有所帮助。入门之后，需要学习一些更加高级的内容和工具来方便我们的爬取。关于requests 库的基本用法。 2. 安装利用 pip 安装 3. 基本请求 3.1 get请求参数是字典，我们也可以传递json类型的参数： 3.2 post请阅读全文

posted @ 2020-05-18 10:11 ｜Thresh｜阅读(205) 评论(0) 推荐(0)

python爬虫学习笔记(五)-URLError与Cookie

摘要：1. Cookie 为什么要使用Cookie呢？ Cookie，指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据（通常经过加密）比如说有些网站需要登录后才能访问某个页面，在登录之前，你想抓取某个页面内容是不允许的。那么我们可以利用Urllib库保存我们登录的Cooki 阅读全文

posted @ 2020-05-18 10:04 ｜Thresh｜阅读(226) 评论(0) 推荐(0)

python爬虫学习笔记(四)-urllib库的高级用法

摘要：1. 伪装自己有些网站不会同意程序直接用上面的方式进行访问，如果识别有问题，那么站点根本不会响应，所以为了完全模拟浏览器的工作 1.1 设置请求头其中代表用的哪个请求的浏览器代码如下：对付防盗链，服务器会识别headers中的referer是不是它自己，如果不是，有的服务器不会响应，所以我阅读全文

posted @ 2020-05-18 09:56 ｜Thresh｜阅读(205) 评论(0) 推荐(1)

python爬虫学习笔记(三)-爬取数据之urllib库

摘要：1. 小试牛刀怎样扒网页呢？其实就是根据URL来获取它的网页信息，虽然我们在浏览器中看到的是一幅幅优美的画面，但是其实是由浏览器解释才呈现出来的，实质它是一段HTML代码，加 JS、CSS，如果把网页比作一个人，那么HTML便是他的骨架，JS便是他的肌肉，CSS便是它的衣服。所以最重要的部分是存阅读全文

posted @ 2020-05-18 09:53 ｜Thresh｜阅读(390) 评论(0) 推荐(0)

python爬虫学习笔记(二)-工具的使用

posted @ 2020-05-17 22:20 ｜Thresh｜阅读(238) 评论(0) 推荐(0)

python爬虫学习笔记(一)-爬虫介绍

摘要：1. 什么是爬虫？网络爬虫也叫网络蜘蛛，如果把互联网比喻成一个蜘蛛网，那么蜘蛛就是在网上爬来爬去的蜘蛛，爬虫程序通过请求url地址，根据响应的内容进行解析采集数据，比如：如果响应内容是html，分析dom结构，进行dom解析、或者正则匹配，如果响应内容是xml/json数据，就可以转数据对阅读全文

posted @ 2020-05-17 21:43 ｜Thresh｜阅读(447) 评论(0) 推荐(1)

永恒之蓝漏洞的利用测试

摘要：永恒之蓝漏洞的利用测试一、环境及工具系统环境：虚拟机Kali Linux 2、Windows 7 网络环境：交换网络结构实验工具： Metasploit、Nmap IP地址：Kali-Linux 2：192.168.0.104；Windows 7 ：192.168.0.101 二、操作步骤阅读全文

posted @ 2020-05-17 21:24 ｜Thresh｜阅读(1692) 评论(0) 推荐(0)

漏洞渗透的简单测试

摘要：一、漏洞渗透测试 1、靶机安装easy file sharing server（efssetup_2018.zip） 2、利用Nmap扫描发现靶机(Windows)运行了该服务。P99-100 3、利用该漏洞，使得靶机运行计算器。P116-119 具体实现过程：使用namp扫描目标计算机：阅读全文

posted @ 2020-05-17 21:23 ｜Thresh｜阅读(971) 评论(0) 推荐(0)

关于webshell的使用学习

摘要：通过使用cknife，菜刀，冰蝎三种WebShell，使用wireshark抓包分析数据，了解这三者的工作原理。菜刀使用通过在靶机上挂马，使用菜刀连接靶机获得靶机网站管理写入一个文件然后用wireshark抓包分析通信流量看看通信端口在80，以http post通讯追踪流红色部分即阅读全文

posted @ 2020-05-17 21:19 ｜Thresh｜阅读(2448) 评论(0) 推荐(1)

python处理word和excel文件

摘要：python处理word和excel表格数据学习过程中遇到批量将excel表格数据填入到word的问题，对于excel的函数使用不是很熟悉，python中有处理word和excel的库，所以学习使用python实现对数据的批量处理。首先是需要了解处理word和excel的具体操作。 python对阅读全文

posted @ 2020-05-17 20:59 ｜Thresh｜阅读(2529) 评论(0) 推荐(0)

Python编程技巧（二）

摘要：2.1在列表，字典，集合中根据条件筛选数据 1.过滤列表中的负数通常使用迭代 from random import randintdata=data=[randint(-10,10) for _ in range(10)]res=[]for x in data: if x>=0: res.appe 阅读全文

posted @ 2020-05-13 23:47 ｜Thresh｜阅读(530) 评论(0) 推荐(0)

2020年4月蓝桥杯模拟赛题-python

摘要：2020年蓝桥杯省赛模拟赛-python题解题目1 问题描述一个包含有2019个结点的无向连通图，最少包含多少条边？答案提交这是一道结果填空的题，你只需要算出结果后提交即可。本题的结果为一个整数，在提交答案时只填写这个整数，填写多余的内容将无法得分。答案：2018 题目2 问题描述将L 阅读全文

posted @ 2020-05-13 17:43 ｜Thresh｜阅读(8319) 评论(0) 推荐(4)

｜Thresh｜的博客

05 2020 档案

公告