摘要: 之前用scrapy爬取网页时经常出现需要验证码,但是返回的是个response对象,不知道要如何进行破解。以往都是selenium进行截图验证码,模拟拖动,但是scrapy在yield请求后就直接走了,不知道如何... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(797) 评论(0) 推荐(0)
摘要: 对于爬虫而言验证码是一定要经过的坎,对于网站... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(269) 评论(0) 推荐(0)
摘要: 本文仅作经验分享,不做商业用途,如涉及权利问... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(2042) 评论(3) 推荐(0)
摘要: selenium被检测可以尝试一下 阅读全文
posted @ 2019-12-10 10:36 上周的bug还没搞好 阅读(4726) 评论(1) 推荐(0)
摘要: js破解天某查股权穿透图 阅读全文
posted @ 2019-11-28 18:31 上周的bug还没搞好 阅读(2525) 评论(0) 推荐(0)
摘要: 验证码js破解 阅读全文
posted @ 2019-11-27 09:12 上周的bug还没搞好 阅读(9252) 评论(7) 推荐(1)
摘要: 记一次纠错大战本来今天开开心心地部署nginx和uwsgi到我的Django服务器,刚想给老师演示一遍我这项目如何酷炫时,一登陆就出现mysql连接不上了(2003, "Can't connect to MySQL server on 'localhost' ([Er... 阅读全文
posted @ 2019-03-15 21:19 上周的bug还没搞好 阅读(521) 评论(0) 推荐(0)
摘要: 目标地址:http://weixin.sogou.com/weixin?这个地址是搜狗微信的文章搜索,可以搜索到微信的文章,而我们目标就是这些文章内容这个url经过测试,当我们没登陆微信只能看到10页的内容,我们登陆后才可以查看100页的内容,而且翻页多次会出现ip检... 阅读全文
posted @ 2019-03-10 21:25 上周的bug还没搞好 阅读(887) 评论(0) 推荐(0)
摘要: 在学习python时,不可避免下载了Anaconda,当我打算写爬虫时,urllib,requests,selenium,pyspider都已经安装好了,可以直接使用了,但是有一天我想要使用scrapy模块时,发现竟然没有安装,于是自己参照网上教程写下win64安装s... 阅读全文
posted @ 2019-03-08 17:25 上周的bug还没搞好 阅读(557) 评论(0) 推荐(0)
摘要: 最近复习功课,日常码农生活。import requestsfrom requests.exceptions import RequestExceptionimport reimport jsonfrom multiprocessing import Pool#requ... 阅读全文
posted @ 2019-03-01 22:15 上周的bug还没搞好 阅读(121) 评论(0) 推荐(0)