随笔分类 -  Java爬虫

摘要:java爬虫学习webmagic爬取前程无忧职位信息遇到的一些问题记录一下 1.使用爬取页面跑出"TLSv1.3"不支持异常 由于webmagic作者长期没有发布0.74版本,所以只能手动解决 下载webmagic-core源码,去除"TLSv1.3",在忽视测试在install,即可爬取页面 2. 阅读全文
posted @ 2020-07-20 15:42 少年阿鑫 阅读(563) 评论(0) 推荐(0)
摘要:最近在学习java的爬虫技术,学的是黑马的视频资源,由于是几年前的视频啦,京东页面有些许变化,在此记录我遇到的问题,使用的爬虫技术是httpClient和jsoup,项目搭建使用的springboot+ jpa。 首先给出主页的代码: @Component public class ItemTask 阅读全文
posted @ 2020-07-16 17:08 少年阿鑫 阅读(1540) 评论(0) 推荐(0)