摘要: 摘要 分析验证码素材图片混淆原理,并采用selenium模拟人拖动滑块过程,进而破解验证码。 人工验证的过程 1. 打开威锋网注册页面(https://passport.feng.com/?r=user/register) 2. 移动鼠标至小滑块,一张完整的图片会出现(如下图1) 3. 点击鼠标左键阅读全文
posted @ 2017-08-15 09:41 卧颜沉默 阅读(835) 评论(11) 编辑
摘要: 摘要 上一篇以知乎网为例简单分享网络请求分析。这一篇主要分享一种应对反爬虫的方法,前端数据混淆。 目的 之前写https://github.com/wycm/zhihu-crawler项目的时候,需要用到免费的http代理,然后找到了这个 http://www.goubanjia.com/ 这个网站阅读全文
posted @ 2017-05-19 17:31 卧颜沉默 阅读(783) 评论(9) 编辑
摘要: 摘要 从零实现一个高性能网络爬虫系列教程第一篇,后续会有关于url去重、如何反爬虫、如何提高抓取效率、分布式爬虫系列文章。以我写的一个知乎爬虫为Demo讲解,github地址 (https://github.com/wycm/zhihu-crawler) ,有兴趣的朋友可以star下。网络请求的分析阅读全文
posted @ 2017-04-27 11:05 卧颜沉默 阅读(1895) 评论(1) 编辑
摘要: 由于windows系统没有提供本地回环网络的接口,用Wireshark监控网络的话看不到localhost的流量。 想要获取本地的网络数据包,可以通过一款小巧的开源软件RawCap来进行抓包,然后使用Wireshark进行分析。阅读全文
posted @ 2017-04-18 10:50 卧颜沉默 阅读(652) 评论(2) 编辑