python爬虫 - 理性绕过各大平台的反爬检测

 后面会慢慢完善,先作为笔记记录一下

 

 

需要账号的 

现在是大数据时代,各个平台争抢的就是用户数据,用户数据怎么来,就是账号注册来的,在注册的时候设置的一些问题,不管你是否如实填写,都会对你这个账号做用户画像,提取该账号的喜欢和不喜欢,加上再获取通讯录权限,获取手机推送权限,然后每天一点点的搜集数据,到了一定
程度后,开始对这个账号进行重组信息,匹配出相似数据推送给你。
那么,也就是,作为一个正常人对于平台的价值就是获取数据。

那作为爬虫,可以伪造一个人设,然后这个账号就尽量的往这方面去贴靠,平台不就是想要这些数据嘛,那就给他啊,每天随机的上线平台,然后

随机的刷数据,遇到跟这个人设喜欢的东西就疯狂访问,点喜欢和收藏,与同爱好的其他账号互动

也就是先准备一批账号,然后对这些账号作人设分类,以后就各自维护各自的人设,人设可以随机的小方向的改动,比如以前这个账号很喜欢某个明星或者方向,然后因为什么突然的不喜欢,甚至是讨厌,那就不要再访问该明星相关的信息,但是这种从喜欢到讨厌一定要有关联性,比如,你
是通过这个明星A 发现的明星B,然后你会经常访问B的主页,这样才是正常的行为,或者说这个明星吸毒或者是港独台独之类的,如果没有关联性的话,那就很可能被设置为可疑对象。一定不能是很极端的改动,比如这个账号以前很喜欢特朗普,突然的有天很讨厌特朗普,天天就是一顿骂,
这种涉及到时事政治的大改动,一定是不行的。

这样一直往后的去处理,其实也可以说是在养号,然后这个账号到了某个时刻需要发布一些个人相关的数据,比如这个账号已经注册了好几年,可以发一些对这个平台的感受的言论,或者到了一定年纪,比如28岁了,发布一个假的结婚信息或者恋人信息,32岁了,孩子有了,发布一些孩子的
信息,这个信息可以是假的,不一定要是本人,但如果有露脸就一定要是同一个人,到了40岁,到了50岁该干嘛。
时而发布一些搞笑的东西,时而发布一些消极的数据,贴靠正常人的行为
总之就是做一些在采集的角度看来很多“毫无意义”的事,但是这些正好能辅助我们的账号的安全正常等级越来越高,也就也越不容易被封号 

无账号的,直接硬刚

大厂都有收集代理ip,会做代理ip所属对比,选用的代理ip一定不能太大众化
访问速度和访问频率控制
浏览器:谷歌验证(验证码,recapcha),网易易盾,极验,数美,瑞数
app:加固包(腾讯乐固,360加固,爱加密,梆梆加密),ssl pinning,sign加密验证,微信,qq授权登陆,frida反调试,签名验证防二次打包等

posted @ 2021-06-02 19:20  Eeyhan  阅读(722)  评论(0编辑  收藏  举报