摘要:
(需要知道某个元素在另外一个集合中是否存在,有一定的误伤率) 1、蜘蛛爬行需要判断此URL是否已经爬过2、2个比较大的文件需要知道重复的数据有哪些?(第一个文件存到hash_set中,遍历一遍第二个文件即可) PHP的 Bloom-filterhttp://code.google.com/p/php-bloom-filter/ 阅读全文
posted @ 2012-05-31 11:46
Jason-zy
阅读(145)
评论(0)
推荐(0)
浙公网安备 33010602011771号