摘要: HttpClient和 HtmlParser实现爬虫 网络爬虫技术1 什么叫网络爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按... 阅读全文
posted @ 2016-09-28 15:42 写代码其实苦的 阅读(114) 评论(0) 推荐(0)
摘要: 网络爬虫技术 1 什么叫网络爬虫 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 2 网络爬虫的分类 网络爬虫按照系统结构和实现技术,大致可以 阅读全文
posted @ 2016-09-28 15:42 写代码其实苦的 阅读(1001) 评论(0) 推荐(0)