摘要: Beautiful Soup 是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。 一、安装 sudo pip3 install beautifulsoup4 二、使用 导入模块 from bs4 import BeautifulSoup 创建BeautifulSo 阅读全文
posted @ 2021-01-24 00:38 eliwang 阅读(2603) 评论(0) 推荐(1) 编辑
摘要: hmac(hex-based message authentication code)算法在计算哈希的过程中混入了key(实际上就是加盐),和hashlib模块中的普通加密算法相比,它能够防止密码被撞库破解,安全性更高。 hmac模块的使用: 导入模块 In [1]: import hmac #导入 阅读全文
posted @ 2021-01-21 16:32 eliwang 阅读(4351) 评论(0) 推荐(2) 编辑
摘要: 使用lxml之前,我们首先要会使用XPath。利用XPath,就可以将html文档当做xml文档去进行处理解析了。 一、XPath的简单使用: XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进行遍历。 1.开发工具的安 阅读全文
posted @ 2021-01-20 01:56 eliwang 阅读(1105) 评论(0) 推荐(1) 编辑
摘要: 只需要在Linux上安装lrzsz工具包就可以,然后使用命令sz下载文件,rz上传文件。 一、安装lrzsz工具包 sudo apt-get install lrzsz 二、从Linux下载文件--(sz命令) sz 文件名 会从当前目录选择目标文件进行下载,并弹出保存文件的窗口,您可以自行选择文件 阅读全文
posted @ 2021-01-19 15:03 eliwang 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 可以通过导入html包,利用html.escape()函数对字符串进行html转义,利用html.unescape()函数对字符串进行html反转义。 In [1]: import html In [2]: html.escape(''' < > ' " & ''') #html转义 Out[2]: 阅读全文
posted @ 2021-01-18 01:08 eliwang 阅读(1236) 评论(0) 推荐(0) 编辑
摘要: 一、什么是正则表达式? 正则表达式,又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 二、正则表达式的匹配规则 阅读全文
posted @ 2021-01-17 03:37 eliwang 阅读(1357) 评论(2) 推荐(1) 编辑
摘要: urllib3是一个功能强大,对SAP健全的 HTTP客户端,许多Python生态系统已经使用了urllib3。 一、安装 sudo pips install urllib3 二、创建PoolManager对象 通过urllib3访问网页,首先需要构造一个PoolManager实例对象用于处理与线程 阅读全文
posted @ 2021-01-15 20:36 eliwang 阅读(2732) 评论(0) 推荐(0) 编辑
摘要: 相比于urllib模块,requests模块使用起来更简洁方便。requests支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的 URL 和 POST 数据自动编码。requests的底层实现其实就是urllib3。 一、安装 sud 阅读全文
posted @ 2021-01-14 21:36 eliwang 阅读(239) 评论(0) 推荐(0) 编辑
摘要: urllib是Python中请求url连接的官方标准库,在Python3中将Python2中的urllib和urllib2整合成了urllib。urllib中一共有四个模块,分别如下: request:主要负责构造和发起网络请求,定义了适用于在各种复杂情况下打开 URL (主要为 HTTP) 的函数 阅读全文
posted @ 2021-01-14 18:34 eliwang 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 一、ubuntu中设置环境变量 1.用于当前用户 用户主目录下有一个隐藏文件.bashrc(~/.bashrc),打开文件后,按照:export 变量名=值来设置,注意值不需要加引号 终端输入命令: sudo vim ~/.bashrc 在文件中写入(开头或结尾都可以,可以设置多个变量): expo 阅读全文
posted @ 2021-01-13 17:40 eliwang 阅读(2340) 评论(0) 推荐(0) 编辑