摘要: 对于百度来说,核心业务是搜索引擎,而对于搜索引擎抓取信息的原理,蜘蛛(爬虫)是实现大量的爬去信息的一个程序。 百度已经屹立中国十来年了,在不断的技术改进中,爬虫技术也不断升级。大概以主动被动可以分为两个阶段。 一、百度主动抓取 1、抓取。对于更早期的百度,没有太多信息存储的时期,百度当然是主动出击, 阅读全文
posted @ 2022-08-19 17:54 记录——去繁就简 阅读(355) 评论(0) 推荐(0)