摘要:
从BdbFrontier对象的next方法(从某个Classkey标识的BdbWorkQueue工作队列)取出来的CrawlURI uri对象第一步要进入的处理器是Preselector处理器,该处理器主要是对CrawlURI uri对象根据配置文件里面配置的正则表达式进行过滤,通过过滤的Crawl... 阅读全文
posted @ 2013-04-30 19:25
刺猬的温驯
阅读(845)
评论(0)
推荐(0)