摘要: 当网址有加密发送安全证书时可以使用verify=False,因为dytt利用的字符编码是gb2312,所以解码也要用gb2312 import requests domain = "https://dy.dytt8.net/index.htm" resp = requests.get(domain, 阅读全文
posted @ 2021-06-23 14:12 YuyuFishSmile 阅读(996) 评论(0) 推荐(0)
摘要: 思路:通过requests获取html前端代码,通过re进行正则匹配,最后存储进csv中 首先导入requests、re、csv 之后再定义一个爬取的方法函数,通过观察url请求发现参数有start和filter,发现传递的参数中以25作为基准,所以在这里定义一个方法用来传递参数 def get_d 阅读全文
posted @ 2021-06-23 11:21 YuyuFishSmile 阅读(112) 评论(0) 推荐(0)