摘要: 基于HttpClient和JSoup的java网络爬虫 `网络爬虫`(Web Crawler),又称为`网络蜘蛛`(Web Spider)或` Web 信息采集器`,是一种按照一定规则,自动抓取或下载网络信息的计算机程序或自动化脚本。网络爬虫**本质上**就是通过模拟浏览器的方式获取服务器数据。 `Java 网络爬虫`具有很好的扩展性可伸缩性,其是目前搜索引擎开发的重要组成部分。例如,著名的网络爬虫工具` Nutch `便是采用 `Java `开发。 阅读全文
posted @ 2022-01-06 17:23 冰茶不冰 阅读(238) 评论(0) 推荐(0)