摘要: 代码是从网上找的,注释是我加的#!/usr/bin/perluse strict;use warnings;use threads;use threads::shared;use Thread::Queue;use Thread::Semaphore;use Bloom::Filter;use URI;use URI::URL;use Web::Scraper;use LWP::Simple;use LWP::UserAgent;use HTTP::Cookies;#use HTTP::Cookies::Guess;use String::Diff;use String::Diff qw(di 阅读全文
posted @ 2011-05-26 20:28 张朝阳 阅读(5113) 评论(0) 推荐(0) 编辑
摘要: Bloom::Filter,其最大容量为10,判断某一个元素是否在容器中的最大出错概率为0.001。 Web::Scaper是一组用来提取HTML文档中元素内容的工具集,它能够理解HTML和CSS选择器以及XPath表达式。 阅读全文
posted @ 2011-05-26 14:59 张朝阳 阅读(1072) 评论(0) 推荐(0) 编辑