摘要:
爬虫:请求和过滤 编写正则的思路: 1. 找到包裹所有数据的父标签 2. 通过[\s\S]*?跳到需要数据标签开头,写上标签开头作定位开头 3. 用(?P<标签>[\s\S]*?)分组提取该数据 4.写上此标签结尾作定位结尾 5.重复第二步到需要的数据都被分组包裹 <div class="banne 阅读全文
posted @ 2021-10-08 22:06
remix_alone
阅读(481)
评论(0)
推荐(0)
摘要:
简介 re是python的正则模块 方法 re.complie(str) 参数: str:正则模式 返回值:pattern 返回值作用:获取正则对象 作用:获取正则对象 pattern.findall(content) 参数: content:内容对象 返回值:list 返回值意义:获取conten 阅读全文
posted @ 2021-10-08 22:00
remix_alone
阅读(74)
评论(0)
推荐(0)
摘要:
简介 正则:用模式匹配字符串 元字符下的匹配字符和量词组成 匹配字符 单字符串 [ 任意字符组合 ]:匹配中括号内其中之一 ():分组。在python内,用(?P<键值>)标记分组内匹配的字符串 \d:任意数字 .:除换行符外任意字符 [\s\S]:任意字符 量词: {n,m}:匹配至少n次,至多m 阅读全文
posted @ 2021-10-08 21:51
remix_alone
阅读(118)
评论(0)
推荐(0)