摘要: # 前言 关于app爬虫,本人是第一次接触,通过查找各方资料,对本次app爬虫的过程做一个记录 # 通过fiddler尝试抓包 ## 通过[**fiddler**](https://www.telerik.com/download/fiddler)+[**夜神模拟器**](https://www.y 阅读全文
posted @ 2023-06-14 14:31 w_poison 阅读(252) 评论(0) 推荐(0)
摘要: 最开始接触python操作数据库,使用的别人的代码,基于第三方包pymmsql所开发的,使用一段时间之后,做一点小小的总结,若有不足之处,欢迎指正 1. 查询返回字典 初始化游标的时候,设置参数as_dict=True即可,返回的结果中,每一条数据即为一个字典。前提是查询的sql中,不能出现相同的列 阅读全文
posted @ 2021-08-03 10:41 w_poison 阅读(400) 评论(0) 推荐(0)
摘要: 思路是抽取页面所有链接,根据网站host以及一些逻辑分析,剔除掉不必要的网址。计算每个xpath对应的链接数,取其中最大值。代码依赖于jsoup、httpclient 一、抽取网页所有链接并进行一些过滤 1 public static ArrayList<String> getList(String 阅读全文
posted @ 2019-10-17 18:34 w_poison 阅读(233) 评论(0) 推荐(0)