文章分类 -  爬虫

如何搭建***[转]
摘要:原文地址 http://blog.sina.com.cn/s/blog_43a59c7a0102x8tt.html 验证可行的 第一大步:购买一个 VPS (无需写代码) 这里的 VPS 就是虚拟服务器的意思,不过懂不懂这个都不是重点。我买的是Vultr家的,原因是这家网站做的很漂亮,特别是英文字体 阅读全文
posted @ 2019-09-22 15:21 一天不进步,就是退步 阅读(7) 评论(0) 推荐(0)
Python知识图谱
摘要:http://www.sohu.com/a/150435246_453160 阅读全文
posted @ 2018-09-21 17:16 一天不进步,就是退步 阅读(2301) 评论(0) 推荐(0)
使用深度学习来破解 captcha 验证码
摘要:https://blog.csdn.net/c2a2o2/article/details/68490189 本文会通过 Keras 搭建一个深度卷积神经网络来识别 captcha 验证码,建议使用显卡来运行该项目。 下面的可视化代码都是在 jupyter notebook 中完成的,如果你希望写成 阅读全文
posted @ 2018-07-21 23:36 一天不进步,就是退步 阅读(8202) 评论(4) 推荐(0)
爬虫数据采集技术趋势-智能化解析
摘要:https://www.cnblogs.com/codemind/p/smart_spider_parser.html 用一句话概括爬虫工程师的工作内容,就是We Structure the World's Knowledge。 爬虫工作内容 互联网作为人类历史最大的知识仓库,是没有充分结构化的。目 阅读全文
posted @ 2018-07-02 10:01 一天不进步,就是退步 阅读(178) 评论(0) 推荐(0)
Hook原理
摘要:Hook原理 对于会Hook的人来说,Hook其实也就那么回事。对于没有Hook过的人来说,会感觉Hook很高大上(其实也没毛病)。 那么今天我们就来探讨一些Hook的原理是什么。 我认为任何Hook都可以分为以下三步(简称WFH): 需要Hook的是什么,在哪里(后面简称Where) 寻找到Hoo 阅读全文
posted @ 2018-06-22 10:00 一天不进步,就是退步 阅读(13228) 评论(0) 推荐(2)
手把手教你搭建一个基于Java的分布式爬虫系统
摘要:http://blog.51cto.com/xpleaf/2093952 1 概述 在不用爬虫框架的情况,经过多方学习,尝试实现了一个分布式爬虫系统,并且可以将数据保存到不同地方,类似MySQL、HBase等。 基于面向接口的编码思想来开发,因此这个系统具有一定的扩展性,有兴趣的朋友直接看一下代码, 阅读全文
posted @ 2018-06-06 07:52 一天不进步,就是退步 阅读(10774) 评论(0) 推荐(2)
密码控件安全技术浅析及攻击实例
摘要:https://bbs.pediy.com/thread-175448.htm 密码控件是一个很常见的控件,这篇文章主要介绍一下安全密码控件的一些实现思路和攻击思路。1 物理密码键盘和密码控件的对比先说一下程序中的密码控件和现实中的密码键盘的对比。几乎每个人都在银行或者ATM机器上输入过密码,那在输 阅读全文
posted @ 2018-04-25 14:20 一天不进步,就是退步 阅读(721) 评论(0) 推荐(0)
登录抓包逆向分析学习笔记
摘要:https://bbs.pediy.com/thread-224559.htm 最近在学习ARM汇编和逆向方面的基础知识,抽空跟着“无名”大神的逆向数据分析视频学习了一下,以下是本人在学习过程中的一些心得和笔记,还望各位大牛们指正。 PS:本人已对截图做了相应的打码处理,如有侵权或涉及敏感信息,还望 阅读全文
posted @ 2018-04-25 13:46 一天不进步,就是退步 阅读(465) 评论(0) 推荐(0)
网银安全控件问题
摘要:https://www.jianshu.com/p/035af6ed4fa8 网银的密码输入控件是通过直接读键盘设备IO获取的输入。需要使用驱动级的键盘模拟输入技术才能输进去。 一个是WinIO,肯定能实现,我已测试过,WinIO怎么用可以百度一下,有很多资料。 另外一个是虚拟键盘驱动,网上有个DD 阅读全文
posted @ 2018-04-03 14:55 一天不进步,就是退步 阅读(1117) 评论(0) 推荐(0)
突破NP屏蔽,实现按键模拟!
摘要:http://xinxing124.blog.163.com/blog/static/3017019520113583035830/ nProtect GameGuard、XTRAP是两款比较著名的防作弊软件,在玩家使用外挂(无论任何游戏的外挂,就算不是当前游戏的外挂也不可以)的时候 会提示"检测到 阅读全文
posted @ 2018-04-03 14:54 一天不进步,就是退步 阅读(3795) 评论(0) 推荐(0)
Fiddler抓取手机APP数据包
摘要:https://my.oschina.net/jhao104/blog/605963 第一步:下载神器Fiddler,下载链接: http://w.x.baidu.com/alading/anquan_soft_down_ub/10963 下载完成之后,傻瓜式的安装一下了! 第二步:设置Fiddle 阅读全文
posted @ 2018-04-03 11:06 一天不进步,就是退步 阅读(137) 评论(0) 推荐(0)
图片滑块验证码的解决
摘要:https://blog.csdn.net/w18756901575/article/details/78615275 其他的不多说,直奔主题: 本次是以微信注册中所遇到滑块验证码为例,主要的目的就是让脚本实现自动识别阴影部分的位置,然后计算出距离拖动滑块完成验证操作 想要从1处滑动到2处,就需要知 阅读全文
posted @ 2018-04-01 09:57 一天不进步,就是退步 阅读(1608) 评论(0) 推荐(0)
极验验证的滑动验证码破解
摘要:https://blog.csdn.net/Mtchy/article/details/53507762 题记——毛主席教导我们一切帝国主义都是纸老虎 极验验证(http://www.geetest.com)是目前比较前沿新颖的一种验证方式,相比传统的字符型验证码更加人性化,用户验证的时间更短,更具 阅读全文
posted @ 2018-04-01 09:53 一天不进步,就是退步 阅读(2195) 评论(0) 推荐(0)
网上银行“安全登录控件”分析(zt)
摘要:国内的一些银行的网上银行系统为了用户信息的安全,在登录页面上使用了名为“安全登录控件”的东西,取代了传统的 HTML 的输入控件(Input),下面就对用户量较大的招商银行和工商银行的登录界面及“安全登录控件”做一下对比。 1、招商银行 招商银行的网上银行系统做的比较早,用户也很大,深受大部分用户欢 阅读全文
posted @ 2018-03-28 19:36 一天不进步,就是退步 阅读(328) 评论(0) 推荐(0)
【机器人系列】支付宝支付控件输入框模拟输入,输入框模拟输入
摘要:http://www.bkjia.com/webzh/974312.html 企业中做自动化测试,会用到Selenium,它确实是一个强大,免费,而便捷的自动化测试框架。但有时候我们会遇到一些特别的浏览器输入控件,他们不是正常的Html input元素,因此Selenium无法获取到。这时候我们需要 阅读全文
posted @ 2018-03-28 19:18 一天不进步,就是退步 阅读(494) 评论(0) 推荐(0)
使用JNA解决自动化测试无法做密码输入操作的问题
摘要:https://blog.csdn.net/bolg_hero/article/details/50072859 在做页面自动化(以使用selenium为例)的时候,很常见的一个场景就是输入密码。往往对于输入框都使用WebElement的sendKeys(CharSequence... keysTo 阅读全文
posted @ 2018-03-28 09:52 一天不进步,就是退步 阅读(895) 评论(0) 推荐(0)
滑块验证码识别 java版本
摘要:https://blog.csdn.net/qq_19383667/article/details/77879895 好久没有更新技术文章了,很久之前研究过滑块验证码的破解,照着别人的代码改,将其他版本的代码改成java的,加上自己的一些研究,凑合凑合出了第一个java版本的,此版本不是控制浏览器进 阅读全文
posted @ 2018-03-28 09:51 一天不进步,就是退步 阅读(389) 评论(0) 推荐(0)