摘要:
1. 需求因为项目需要,需要多次登录某网站抓取信息。所以学习了验证码的一些小知识。文章参考http://blog.csdn.net/problc/article/details/5794460的部分内容。需要程序识别的验证码格式如图所示:,这个图片符合固定大小,固定位置,固定字体,固定颜色的范围,实现起来相对简单。验证码识别基本分四步,图片预处理,分割,训练,识别。为便于演示,我这里分更多的步骤。BTW:如果是形如:的验证码,请参考:http://blog.csdn.net/problc/article/details/5797507如果是形如:的验证码,请参考:http://blog.csd 阅读全文
posted @ 2013-08-26 17:12
那些年的事儿
阅读(39906)
评论(5)
推荐(1)
摘要:
新版HttpClient4.2与之前的3.x版本有了很大变化,建议从http://hc.apache.org/处以得到最新的信息。关于HttpCore与HttpClient:HttpCore是位于HTTP传输组件的底层包,可以用来简化HTTP客户端与服务器端的开发。HttpClient是一个符合HTTP1.1版本,基于HttpCore类包的一个实现。它同时为客户端认证、HTTP状态管理、HTTP连接管理提供了可重用的客户端组件。HttpCore类包目前最新发布版本是httpcore-4.2.4;HttpClient类包的版本是httpclient-4.2.5。了解到HttpCore包与Http 阅读全文
posted @ 2013-08-26 10:26
那些年的事儿
阅读(12113)
评论(1)
推荐(1)
浙公网安备 33010602011771号