会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
稻草人_yhc
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
2020年8月20日
网络动态代理反反爬
摘要: 前些天,写了个爬虫的博客,但是没有实现使用动态代理反反爬,今天补充下。如果想大量爬取数据,建议还是付费购买代理。 pom文件见:https://www.cnblogs.com/yhc-910/p/13440456.html package com.paic.ocss.fps.client.jsoup
阅读全文
posted @ 2020-08-20 10:24 稻草人_yhc
阅读(556)
评论(0)
推荐(0)
2020年8月5日
【反反爬】使用Jsoup爬取数据保存Excel
摘要: 本文主要使用Jsoup爬取XXX房屋信息,抓取一些房屋信息,比如房屋楼盘、户型、价格、地址等信息,然后保存到Excel,便于对比和筛选,选出符合预期的好房。 注意,有些网站有防爬取机制,需要设置动态更换代理IP进行重试。 1 <dependency> 2 <groupId>org.slf4j</gr
阅读全文
posted @ 2020-08-05 15:56 稻草人_yhc
阅读(485)
评论(0)
推荐(1)
上一页
1
2
3
公告