摘要:
啥是增量式爬虫? 增量式爬虫就是爬取那些更新频率很快的网站,但是我们又不想每次都删库再建库,所以有了增量式爬虫。效果是将爬虫内容在数据库中进行判断,如果不存在则存入,存在则不存入的一个爬虫。 我们用什么数据库? 在这里我使用的是redis数据库,因为增量式爬虫的最主要核心就是去重,而redis中有s 阅读全文
posted @ 2019-10-29 09:32
请叫我山楂熊°
阅读(224)
评论(0)
推荐(0)