Fork me on GitHub

2013年8月26日

摘要: Linq4j简明介绍开发JAVA一段时间,面临的一大问题就是集合操作,习惯了LINQ的简洁语法,对JAVA的集合操作实在是无甚好感,只能通过C系的循环实现筛选等操作,由于没有延迟执行特性,内存占用实在不敢恭维。因此便在网上找到了linq4j, 一个针对JAVA的linq移植版本。下面的文章,就会对这一工具进行简要的介绍。一. 安装 该项目的Github地址是:https://github.com/julianhyde/linq4j. 显然是一个个人项目,向作者致敬。 它并没有部署在标准的maven库里,因此需要手动编译生成。使用标准命令行: git clone git://github.com 阅读全文
posted @ 2013-08-26 14:24 HackerVirus 阅读(814) 评论(1) 推荐(0)
摘要: NodeJS + PhantomJS 抓取页面信息以及截图利用PhantomJS做网页截图经济适用,但其API较少,做其他功能就比较吃力了。例如,其自带的Web ServerMongoose最高只能同时支持10个请求,指望他能独立成为一个服务是不怎么实际的。所以这里需要另一个语言来支撑服务,这里选用NodeJS来完成。源码地址对源代码感兴趣的朋友可以在Github获取:https://github.com/miniflycn/url-extract安装PhantomJS首先,去PhantomJS官网下载对应平台的版本,或者下载源代码自行编译。然后将PhantomJS配置进环境变量,输入$ ph 阅读全文
posted @ 2013-08-26 14:10 HackerVirus 阅读(829) 评论(1) 推荐(1)
摘要: 绘制的滑块条Trackbar见了很多种,每种播放器的都有它自己风格的Trackbar,鄙人最近在写一个属于自己的播放器,但是不想使用VS工具箱里面的那个Trackbar,于是上网看了一下资料,自己也模仿地写了一个。 其实写这个控件,关键就是用GDI+来绘图,对于这个Trackbar控件必要的属性和行为(包括方法、事件),一个简单的Trackbar就能做出来了。感觉这个就是一个GDI+章节的练习吧。 我写的这个Trackbar是继承Control类的,不是TrackBar,也不是UserControl类,又不是ScrollableControl类。Trackbar有以下外放的属性MinVal.. 阅读全文
posted @ 2013-08-26 13:58 HackerVirus 阅读(392) 评论(0) 推荐(0)
摘要: Linux 下的多线程编程随着你对编程的深入,多线程是一个免不了的话题,在这里就对多线程做一个比较详细的总结。 首先摆在我们面前的就是什么是线程,以及为么会有这个东西。记得之前学习的时候自己会画一张很大的图,在图中可以详细的写出线程为什么会出现?他是为了解决什么问题才出现的?线程的出项肯定是针对进程的,那就看看它针对进程的那些特性进行了改进吧: 1. 通过每种任务的类型,将各种任务分配给单独的线程,每个线程在处理任务的时候可以采用同步编程的方式 2. 所有的线程都可以访问同一进程内的全局变量/文件描述符/heap memory等,这比多进程中的共享memory等方便很多 3. 线程间的... 阅读全文
posted @ 2013-08-26 12:39 HackerVirus 阅读(153) 评论(0) 推荐(0)
摘要: [原]jQuery EasyUI 1.3.4 离线API、Demo (最新)说明本文下载包为 jQuery EasyUI 1.3.4 离线API、Demo。API 按照分类整理做成了离线版本,文档保证和官网完全一致;Demo 按照分类整理为合集。1.3.3版本中新增 tooltip 新组件,由于1.3.3未作整理,故此说明;官网提供一个Theme Builder地址,可以更丰富的自定义主题皮肤;其他Bug修复和改进功能详见下载包中changlog.txt或官网。预览图Demo:API:下载地址jquery-easyui-1.3.4.zip兄弟版本:jQuery EasyUI 1.2.6jQue 阅读全文
posted @ 2013-08-26 12:35 HackerVirus 阅读(349) 评论(0) 推荐(0)
摘要: 《Single Image Haze Removal Using Dark Channel Prior》一文中图像去雾算法的原理、实现、效果及其他。Posted on2013-08-25 23:36Imageshop阅读(242) 评论(3)编辑收藏 【由于周五写的很匆忙,导致文中内容不详细,周末又仔细的整理和汇总了下,做了大量的修改,因此把原文删除重新发布了】。 在图像去雾这个领域,几乎没有人不知道《Single Image Haze Removal Using Dark Channel Prior》这篇文章,该文是2009年CVPR最佳论文。作者何凯明博士,2007年清华大学毕业,201. 阅读全文
posted @ 2013-08-26 11:43 HackerVirus 阅读(421) 评论(0) 推荐(1)
摘要: urllib2 源码小剖2013-08-25 23:38 by 捣乱小子,272阅读,0评论,收藏,编辑两篇小剖已经完成:urllib 源码小剖urllib2 源码小剖urllib2 对 urllib 改进了好些,整个思路都改了,变得更加灵活,有“高内聚,低耦合”的味道。看看 urllib2 的新特性:将对 url 的处理单独成一个 request 类URLopener 和 FancyURLopener 都下架,取而代之的是 OpenerDirector另添加了 N 多 handlers,这些 handlers 主要对 HTTP 连接,HTTP request 或者 HTTP response 阅读全文
posted @ 2013-08-26 11:40 HackerVirus 阅读(185) 评论(0) 推荐(0)
摘要: 表现层的设计(一)——常用的模式、JSON与DTO上几篇博文介绍了 业务逻辑层和数据访问层,我认为写博文的作用主要是向业界的读者交流一种思想,点到为止,至于学习架构设计,通过几篇博文是讲不清楚的,还需要【基础】扎实的情况下,【反复】研究【权威】的书籍。你会发现我写随笔的特点就是喜欢单一,讲NHibernate就绝不会把easyui参合进来,而这次要谈得json也不会和MVC有什么关系。而实战当中,你会发现我确实可以将他们分开,在需要的时候重新组合各种类库和框架来达到我的目的。表现层(Presentation Layer)它主要由两部分组成:1.界面UI2.表现层逻辑界面UI在.NET中包括的几 阅读全文
posted @ 2013-08-26 11:27 HackerVirus 阅读(4274) 评论(0) 推荐(0)
摘要: 海量数据相似度计算之simhash和海明距离通过采集系统我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的文本数据不多时还比较好用,如果我们的爬虫每天采集的数据以千万计算,我们如何对于这些海量千万级的数据进行高效的合并去重。最简单的做法是拿着待比较的文本和数据库中所有的文本比较一遍如果是重复的数据就标示为重复。看起来很简单,我们来做个测试,就拿最简单的两个数据使用Apache提供的 Levenshtein fo 阅读全文
posted @ 2013-08-26 11:12 HackerVirus 阅读(250) 评论(0) 推荐(0)
摘要: Javascript this 解析Javascript中,this是一个非常有用的关键字, this是在运行时基于函数的运行环境绑定的,但是,如果使用的时候不注意,很容易就出错了。ECMAScript Standard对this的定义看起来非常简单: The this keyword evaluates to the value of theThisBindingof the currentexecution context.其中,对于ThisBinding和execution context, ECMAScript Standard 有另外的详细说明:执行环境(引用http://ecmas 阅读全文
posted @ 2013-08-26 11:04 HackerVirus 阅读(194) 评论(0) 推荐(0)