03 2022 档案
摘要:初学爬虫,不足之处请见谅 官网: 查询源代码 看到想要爬取的信息都在<li>标签下 先爬取<li>标签 正则匹配信息: <li class="sky skyid lv[1-3]( on)?">(.+?)</li> get(url).content.decode('utf-8')# 如果没指定会是乱码
阅读全文
摘要:爬取相关漏洞,并保存到本地文件 思路: 1.找相关的标签一步一步往下查询 2.有cookie才能查询 3.用import re 而不用from re import * 是为了防止冲突 #coding:utf-8 from requests import * import re from bs4 im
阅读全文

浙公网安备 33010602011771号