go4it

just do it

2009年7月23日

网站爬虫解决方案

摘要: 2007年11月09日 星期五 16:24 作者:行健 liu_xingjian http://hi.baidu.com/liu%5Fxingjian/blog/item/5304e8609c7c1c47ebf8f810.html 网站爬虫解决方案一 暨Heritrix抓取 整个步骤包括配置Heritrix处理链、抓取网页、解析和提取内容、建立索引和搜索。 一、Heritrix配置的处理链 1.P... 阅读全文

posted @ 2009-07-23 10:43 cxccbv 阅读(1170) 评论(1) 推荐(0)

导航