网站爬虫解决方案
摘要:
2007年11月09日 星期五 16:24 作者:行健 liu_xingjian http://hi.baidu.com/liu%5Fxingjian/blog/item/5304e8609c7c1c47ebf8f810.html 网站爬虫解决方案一 暨Heritrix抓取 整个步骤包括配置Heritrix处理链、抓取网页、解析和提取内容、建立索引和搜索。 一、Heritrix配置的处理链 1.P... 阅读全文
posted @ 2009-07-23 10:43 cxccbv 阅读(1170) 评论(1) 推荐(0)
浙公网安备 33010602011771号