摘要: 初学网络爬虫,请多多指教以下是我觉得有用的资源总结,资源均来自网上编程语言:java使用网络爬虫:spidermanSpiderman 是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Spiderman主要是运用了像XPath,正则表达式等这些技术来实数... 阅读全文
posted @ 2015-09-06 16:33 zuri 阅读(506) 评论(0) 推荐(0)