随笔分类 -  Python

摘要:前言 XPath(XML Path Language)是一门可以在XML文件中查找信息的路径语言。该语言可以同时对XML文件和HTML文件进行搜索。所以在编写爬虫时可以使用XPath语言对HTML文件或代码进行可用信息的抓取。在Python中可以支持XPath提取数据的解析模块有很多,这里主要介绍  阅读全文
posted @ 2022-03-16 00:15 SunsetR 阅读(388) 评论(0) 推荐(0)
摘要:前言 Python提供了“base64”模块用于编码、解码Base64数据。但是并不是所有的Base64数据都会使用默认的字符表进行编码,所以这里对Python下实现自定义编码字符表解密Base64数据做一个简要记录。(关于Base64内部实现等相关内容可以参考这篇文章) Python2.7 1 # 阅读全文
posted @ 2021-01-05 23:45 SunsetR 阅读(3316) 评论(0) 推荐(3)
摘要:前言 Python 从1.5版本开始使用re模块来处理正则表达式。我们可以使用“re模块”或“re.compile方法”来创建正则表达式对象(re.RegexObject),然后通过调用相应方法来处理字符数据。(关于正则表达式语法的相关内容,可以参考这篇文章,本文不再赘述) 1 # 使用re模块直接 阅读全文
posted @ 2021-01-05 00:00 SunsetR 阅读(99) 评论(0) 推荐(2)