摘要: package http;import com.gargoylesoftware.htmlunit.WebClient;import com.gargoylesoftware.htmlunit.html.HtmlElement;import com.gargoylesoftware.htmlunit.html.HtmlPage;public class http { public static void main(String[] args) throws Exception { WebClient webClient = new WebClient();//创建WebClien... 阅读全文
posted @ 2014-03-05 22:36 dekevin 阅读(591) 评论(0) 推荐(0)
摘要: 本人担任职友集的java工程师五年,其中抓取数据占主要的一部分,抓取的信息只要有两部分,职位和简历,其中职位的抓取量为日均插入量为30万,更新量 为60万,抓取全国300多个人才网站。职友集(现在改名为跳哪网)现在是全国职位量最高的垂直搜索引擎。月均广告收入约20万左右。当然这是经过我们团 队的努力。 我们在职位抓取方面是下了很大的一番功夫,使我们的职位量无法被人超越,首先现在很多人才网站为人防止其它网站抓取它的信息,都在封IP,尤其是中华英才网,我们为了向我们的用户提供大而全的职位信息,时刻作出我们的努力。我们为了解决封IP的问题,我取采取了多代理的方式。充分而均衡的运用多IP,有效的解.. 阅读全文
posted @ 2014-03-05 21:04 dekevin 阅读(547) 评论(0) 推荐(0)
摘要: 使用WebBrowser控件,在documentComplete事件处理器里写1 HtmlElement name = webBrowser1.Document.GetElementById("ctl00$content$loginname");2 if (name != null)3 name.SetAttribute("value", User);4 HtmlElement pass = webBrowser1.Document.GetElementById("ctl00$content$pwd");5 if (pass != n 阅读全文
posted @ 2014-03-05 20:59 dekevin 阅读(873) 评论(0) 推荐(0)
摘要: 这是最近在做的一个项目中提到的需求,把一个现有的窗体应用程序界面嵌入到自己开发的窗体中来,看起来就像自己开发的一样(实际上……跟自己开发的还是有一点点区别的,就是内嵌程序和宿主程序的窗口激活状态问题)。 在codeproject找到了一篇相关的文章(http://www.codeproject.com/Articles/9123/Hosting-EXE-Applications-in-a-WinForm-project),虽然可用,但是很不方便,于是重新设计编写了一个类库,用一个控件完成内嵌其它应用程序的功能。直接上图先: 从打开Adobe Reader那张图片可以看出来所谓的“内嵌程序和.. 阅读全文
posted @ 2014-03-05 20:57 dekevin 阅读(6812) 评论(0) 推荐(0)