导航

2016年1月28日

摘要: 严格意义来说,采集器和爬虫不是一回事:采集器是对特定结构的数据来源进行解析、结构化,将所需的数据从中提取出来;而爬虫的主要目标更多的是页面里的链接和页面的TITLE。 采集器也写过不少了,随便写一点经验吧,算是给自己的一个备忘。 首先是最简单的:静态页面采集器。即所采集的数据来源页面是静态的,至少采 阅读全文

posted @ 2016-01-28 09:40 Beta-TNT 阅读(2239) 评论(3) 推荐(0)