元宝家园 --- 坚持理想,脚踏实地,不断学习

自动登录

摘要: 2.0主要主要改进: 1、增加新的验证码自动识别能力。 2、取消上线包办的注册功能,改为下载即可自动存点。 3、更改了配置文件的存放方式,所有文件在同在EXE目录下,成为绿色可拷贝方式。 4、制做安装包,更换了图标。 新版本下载 元宝NewBar V2.0 最终版(需要.NET Framework 2.0 版可再发行组件包(x86)支持)阅读全文
posted @ 2008-11-11 16:57 元宝 阅读(1709) | 评论 (10) 编辑

摘要: 以下是我在网上找到的一篇关于bp神经网格识别验证码的文档,我做成flash文档了。很适合初学验证码识别的的朋友!阅读全文
posted @ 2008-04-28 11:58 元宝 阅读(1622) | 评论 (5) 编辑

摘要: 以下是我在网上找到的一篇关于图像分割的文档,我做成flash文档了。建议做验证码的朋友好好看看(个人认为,复杂验证码难就难在如何分割,呵呵)!阅读全文
posted @ 2008-04-28 11:16 元宝 阅读(1041) | 评论 (3) 编辑

摘要: 最近做一些图像处理,需要将图像中的一些像素过滤一下,有网友给提了个名词:腐蚀算法。我不是学图像学的,乍一听,觉得很神奇。后来从网上收集了一些VC 代码,研究了一下,发现其它也就是那么回事。尤其是腐蚀算法,我在以前的验证码图片去噪声的文章中提到过,只是那是我不知叫什么名词,就从用途出发,叫做 “根据周边点数去噪”。腐蚀的原理也一样,就是根据当前点的周边点数(如3X3的,周边就有8个点)来修改当前点的状态的。
代码是我从VC代码中转译过来的,注释都沿用了原作者的文字(别说是剽窃,^_^)。唯一改进的地方是,原代码功能只能处理0和255的二值灰度(搞不懂为什么这样,对于250、128这样的都不行,还不如弄成二值灰度,别弄256灰度了),我将之改成了能根据0~255中任意灰度划界的256灰度图像!
以下是C#代码:阅读全文
posted @ 2008-04-12 09:37 元宝 阅读(5777) | 评论 (4) 编辑

摘要: 博客园里人气还不错,常有人发表一下对博文的理解和认识,这本是很好很好的事。可有一些人,借用博客园开放的环境,尽做一些损人利已,破坏和谐气氛的事!比如,元宝的这个园子,近两天总有一个人,往这上面发垃圾广告,一发就是几十个,几乎在我每个文章的评论区都发一个,实在是可笑又可恨!手动删除起来有点费事,又懒得自已去编程去实现批量删除!博客园的设置里,还没有对指定IP或关键字过滤的功能,建议“博客园”的作者考滤-下增加此功能!!还博客园一个干净的环境!
相信有不少的博主都遇到过这种事,大家讨论一下,如何解决啊?阅读全文
posted @ 2008-04-09 08:37 元宝 阅读(2391) | 评论 (3) 编辑

摘要:
1、WebBrowser设置Cookie
2、将WebBrowser的cookie信息传给HttpWebRequest.阅读全文
posted @ 2008-04-02 08:26 元宝 阅读(9544) | 评论 (1) 编辑

摘要: 1、抓取POST数据
在OmniPeek软件中,通过“New Capture"--"Start Capture"--打开网页完成操作--”Stop Capture"等一系列过程完成数据抓取。
2、快速定义过滤器
OmniPeek有快速定义过滤器的方法:
3、通过自定义过滤器查找关心的数据
过滤好“HTTP_POST”过滤器后,就可很快过滤刚抓取的数据了
阅读全文
posted @ 2008-03-24 12:57 元宝 阅读(4882) | 评论 (3) 编辑

摘要: 首先声明,本文适合初学者看。 自从发表两篇关于《验证码图片识别的类》文章后,不断有网友来信与我交流相关技巧与经验,本人从中也得到了不少启示。但更有一些初学者不太了解验证码识别的过程,有点人直接下载我的那个类或示例后,连自己的验证码特征库都不建立,直接就用在别的验证码上,还问我为什么不能得到正确的字符(用的示例中的 CodeArray,这是某一图片专用的,晕)。 正常的情况下,拿一个验证码后,应先分析它,并编写一定代码,提取并保存特征库,如下图,这是我的一个验证码分析程序(匆忙抓图,就不讲究美工了),初学者看明白后,自己仿写一个吧。阅读全文
posted @ 2007-12-12 13:52 元宝 阅读(5678) | 评论 (35) 编辑

摘要: 自从发表了用于验证码图片识别的类(C#代码)后,不断有网友下载这个类后,问如何用于一些特定的验证码。总结一下网友们的提问,很多都是不会从复杂背景中提到干净的字符图片来,这主要就是一具去噪问题,即除去图片上的背景、干扰点、干扰线等信息。这当中要用到很多图像学数学算法,首先声明,本人不是学图像学的,以下方法理论说得不对,敬请多批评指正。
1、如何设前景/背景的分界值
2、如何去除干扰点/干扰线
2.1 干扰点/干扰线的特征分析
2.2 根据周边有效点数去噪函数
2.3 滤波算法去噪函数阅读全文
posted @ 2007-11-14 17:13 元宝 阅读(5324) | 评论 (8) 编辑

摘要: 在很多的验证码图片中,作者会刻意将图片中的文字“扭曲”一下,如下变成斜体。这样就会增加程序识别的难度。作为挂机程序的编写者,自然要反其道而行之,比较有效的一种方法是将“扭曲”的过程反过来校正一下,如图。这样处理,就比较容易分割了。
实现的代码如下: 阅读全文
posted @ 2007-10-06 17:16 元宝 阅读(2619) | 评论 (6) 编辑

摘要: 自从本人的博园开通以来,总是不段收到一些广告邮件,平时也懒得打开。今天闲来无事,打开了一封www.wow321.com邮件,本来是随便玩玩的,却无意间发现这个站点的作者还是有点水平,在防作弊上采取了一定的手段。如下,点击网页中的连接,可以正常打开:
点击1
点击2
但是,如果将其中的URL拷贝到IE的地址栏中,直接运行,则会弹出错误信息。看来如果要做一个自动挂机程序,还得再研究一下。
http://www.wow321.com/pay/go.asp?u=yuanbao&ad=1
http://www.wow321.com/pay/go.asp?u=yuanbao&ad=5
想想也是,这个网站号称简单点击即可,自然会想法设法在URL的“来龙去脉”作一些限制。阅读全文
posted @ 2007-10-03 18:10 元宝 阅读(640) | 评论 (6) 编辑

摘要: 网络程序员非常有必要了解如何自动拨号的种种方法,以便于自已在程序中控制网络连接。根据个人的经验总结,一般有以下方法技巧:
1、调用Windows命令RasDial.exe(或RasPhone.exe),可以由Shell直接运行,也可由.bat或.VBS脚本运行
2、调用WindowAPI函数InternetDial("wininet.dll")等
3、调用别人已封装好的类库,如下就是网友封装的自动拨号类
4、列出当前机器上所有网络连接,可以用上面的封装类,也可以直接查询注册表
阅读全文
posted @ 2007-09-26 12:02 元宝 阅读(3445) | 评论 (1) 编辑

摘要: 自从用上VS2005后,发现多了个WebBrowser控件(.net 2003中不带),为图方便吧,有好多小工具就用这个写的,慢慢也有点体会了,总结一下,与网友们共享吧。
1、如何获得“打开网页出错”信息
2、如何使用IHTMLDocument2等MSHTML功能
3、如何提取网页中的图片,尤其是验证码图等以流方式返回的图片
4、如何屏蔽掉Alert()类型的弹出窗口阅读全文
posted @ 2007-09-12 14:32 元宝 阅读(2282) | 评论 (0) 编辑

摘要: 当IE浏览器遇到脚本错误时浏览器,左下角会出现一个黄色图标,点击可以查看脚本错误的详细信息,并不会有弹出的错误信息框。当我们使用WebBrowser控件时有错误信息框弹出,这样程序显的很不友好,而且会让一些自动执行的程序暂停。我看到有人采取的解决方案是做一个窗体杀手程序来关闭弹出的窗体。今天探讨的方法是从控件解决问题。


1、SHDocVw.dll

在COM时代我们使用的WebBrowser控件是SHDocVw.dll。屏蔽错误信息的方法很简单使用下面的一句就可以搞定。

WebBrowser1.Silent = true;
2、.Net中

在.Net中提供了托管的WebBrowser可供我们使用,当然我们仍然可以在.Net中使用COM组建SHDocVw.dll,如果使用SHDocVw.dll
处理错误方式和上面的方法一样。但如果我们是使用.Net组件如何解决这个问题呢?

3、上面的方法对于多个框架嵌套等等的情形还是不能很好的解决。

为了彻底解阅读全文
posted @ 2007-09-04 09:47 元宝 阅读(879) | 评论 (0) 编辑

摘要: MSHTML是微软公司的一个COM组件,该组件封装了HTML语言中的所有元素及其属性,通过其提供的标准接口,可以访问指定网页的所有元素.MSHTML对象模型是由一些对象和集合组成的.处于根部的是HTML,描述了打开页面的1个窗口,包括一系列集合和对象。如Frames集合,History,Location,Navigator,Document,Vi—sum,Event对象等.其中描述呈现在客户窗口实际网页的是Document对象。由一系列的属性、方法、对象和集合组成.其中All集合中包含网页中所有标记(Tag)元素,其主要的方法和属性有:
  (1)Length(长度):即标记出现的个数,可以把标记的集合理解为从0开始的一维数组,其次序按照标记在网页位置排列;
  (2)Tags(标记):用于过滤出给定标记的集合,如Doc.Al1.Tags(P)得到所有分段标记P;
  (3)Item(项目):用于选择集合中的某1个元素,如object.item(0)得到集合的第1个元素,而object.item(i)得到第i+1个元素.
此外,IHTML阅读全文
posted @ 2007-09-03 13:23 元宝 阅读(1968) | 评论 (0) 编辑

摘要: 今天看到有网友留言,让我在"元宝NewsBar"的基础上,开发“点我网”的工具。上网一查,用的人还不少,那就先注册一个,自己先用用看。但愿能同样开发出挂机程序来!

我的“点我网”链接地址是:
http://www.dian265.com/Refer.aspx?UserName=yuanbao 阅读全文
posted @ 2007-08-31 22:07 元宝 阅读(332) | 评论 (0) 编辑

摘要: 自从我在博客上发布自己写的Newsbar挂机程序以来,得到了很多网友的支持(短短几天已下载过百,点击率在本人博文中排第一)。这当中,也有不少好心的网友试用后,提出了很多反馈意见。这几天抽时间改了改,现已上传最新版本1.0.1。 新版本的改进如下: 1、程序启动时,杀掉内存中已存在的进程。 这样做的目的是为了更好地自动运行,有网友将元宝Newbar添加到Windows计划任务中定时启动,有时会出现同一个账户运行两次的Bug。 2、修正了偶而出现的存点已满,菜单不变灰也不退出的Bug。 3、更新上线用户查询功能,适应http://www.ads4cn.com/newsbar/改版后的自动查询功能。阅读全文
posted @ 2007-08-31 15:09 元宝 阅读(229) | 评论 (0) 编辑

摘要: 网页自动登录和提交POST信息的核心就是分析网页的源代码(HTML),在C#中,可以用来提取网页HTML的组件比较多,常用的用WebBrowser、WebClient、HttpRequst这三个。以下就分别用这三种方法来实现:
1、WebBrowser是个"迷你"浏览器,其特点是Post时不用关心Cookie、内置JS等问题
2、WebClient封装了HTTP的一些类,操作简单,相较于webBrowser,特点是可以自设代理,缺点是对COOKIE的控制
3、HttpRequest较为低层,能实现的功能较多,Cookie操作也很简单阅读全文
posted @ 2007-08-31 14:45 元宝 阅读(9017) | 评论 (2) 编辑