摘要:
初学爬虫,不足之处请见谅 官网: 查询源代码 看到想要爬取的信息都在<li>标签下 先爬取<li>标签 正则匹配信息: <li class="sky skyid lv[1-3]( on)?">(.+?)</li> get(url).content.decode('utf-8')# 如果没指定会是乱码 阅读全文
posted @ 2022-03-03 16:39
mingyepf
阅读(176)
评论(0)
推荐(0)
摘要:
爬取相关漏洞,并保存到本地文件 思路: 1.找相关的标签一步一步往下查询 2.有cookie才能查询 3.用import re 而不用from re import * 是为了防止冲突 #coding:utf-8 from requests import * import re from bs4 im 阅读全文
posted @ 2022-03-03 16:37
mingyepf
阅读(285)
评论(0)
推荐(0)