随笔分类 -  爬虫

各种爬虫的使用方法
摘要:本文详细介绍了用 Java 爬虫框架 webmagic 爬取网站数据的时候,从下载到的 HTML 页面抽取所需信息的三种技术的使用方法:XPath,正则表达式以及 CSS 选择器。 阅读全文
posted @ 2022-08-11 21:57 ThinkingOverflow 阅读(830) 评论(0) 推荐(0)
摘要:本文以爬取 [爱站网百度权重](https://baidurank.aizhan.com/) 为例子,详细介绍了用 Java 爬虫框架 webmagic 爬取网站数据的方法。 阅读全文
posted @ 2022-08-11 21:55 ThinkingOverflow 阅读(702) 评论(0) 推荐(0)