摘要: 2.1 网络爬虫引发的问题 图 网络爬虫的尺寸 网络爬虫的限制 来源审查:判断User-Agent进行限制 检查来访HTTP协议头的User-Agent域,只响应浏览器或者友好爬虫的访问。 发布公告:Robots协议 告知所有爬虫网站的爬取策略,要求爬虫遵守 2.2 Robots协议 Robots 阅读全文
posted @ 2020-01-12 10:12 cripplepx 阅读(188) 评论(0) 推荐(0)