摘要: 总所周知,对于python而言实现tcp/udp的传输一般靠的是socket这个库,而区分两者的是建立socket的参数 SOCK_STREAM 为TCP连接 SOCK_DGRAM 为UDP连接 而一般情况下接收报文需要遵从某一些协议,这样双方可以通过特定的粘包解包操作处理数据。 很多情况自定义协议 阅读全文
posted @ 2020-05-09 10:45 上周的bug还没搞好 阅读(1281) 评论(0) 推荐(0) 编辑
摘要: 见多了前端各种js的混淆,参数的加密,虽然抓包会拿到最后的结果,但是一步步分析是真的折磨人,像一些恶心的sojson混淆,可能会让人看着各种参数而头皮发麻。 这里分享一些常用的hook js的方法,与反爬一起进步! //hook window对象的__pt__属性的设置与取值(function(){ 阅读全文
posted @ 2020-03-03 10:21 上周的bug还没搞好 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 材料清单dockerscrapy当我们经常遇... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(617) 评论(0) 推荐(0) 编辑
摘要: 这种问题一般是退出flask服务时选择了disconected而不是选择terminate,dicconected是一种伪断开,只是在pycharm这里中止了,但是python解释器依旧在运行这个服务。 默认选项... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(610) 评论(0) 推荐(0) 编辑
摘要: centos下 python3无法print... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(274) 评论(0) 推荐(0) 编辑
摘要: 本文旨在经验交流,如若侵犯利益,请联系删除。2019.09.10下面的例子已经改为阿里的人机认证了,但是其实用selenium启动浏览器后,依旧可以用pynput来操控键鼠来完成模拟操作,单纯调用send_key... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(6324) 评论(3) 推荐(1) 编辑
摘要: 熟悉爬虫的,必定会熟悉各种反爬机制。今天就讲一下自己如何建立ip代理池的。一个合格的代理池必须拥有一个爬取代理IP的爬取器、一个验证IP可否使用的校验器、一个存储IP的数据库、调用这些的调度器以及可以供获取IP的... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(695) 评论(0) 推荐(0) 编辑
摘要: 之前用scrapy爬取网页时经常出现需要验证码,但是返回的是个response对象,不知道要如何进行破解。以往都是selenium进行截图验证码,模拟拖动,但是scrapy在yield请求后就直接走了,不知道如何... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(742) 评论(0) 推荐(0) 编辑
摘要: 对于爬虫而言验证码是一定要经过的坎,对于网站... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 本文仅作经验分享,不做商业用途,如涉及权利问... 阅读全文
posted @ 2019-12-11 18:28 上周的bug还没搞好 阅读(1871) 评论(3) 推荐(0) 编辑