Fork me on GitHub
摘要: 上次用的java相关知识实现了一个简单的网络爬虫,现在存在许多开源免费的爬虫工具,相对来说,可以很简单的获取网页数据,并写入到本地。 下面我就阐述一下我用Heritrix爬虫工具实现网页数据爬取。 > 目录 1、Heritrix文件配置 2、Heritrix服务器job配置 3、如何创建job并执行 阅读全文
posted @ 2017-08-15 16:38 sunwengang 阅读(6972) 评论(0) 推荐(1) 编辑