摘要:
一个网络蜘蛛就是一种机器人,或者软件代理。大体上,它从一组要访问的URL链接开始,可以称这些URL为种子。爬虫访问这些链接,它辨认出这些页面的所有超链接,然后添加到这个URL列表,可以称作检索前沿。这些URL按照一定的策略反复访问。 主要内容 · 1 爬行策略 o 1.1 选择策略 § 1.1.1 阅读全文
posted @ 2018-06-19 18:43
coder-2017
阅读(102)
评论(0)
推荐(0)

浙公网安备 33010602011771号