会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
springionic
博客园
首页
新随笔
联系
订阅
管理
2019年6月30日
正则爬取某段子网站前20页段子(request库)
摘要: 首先还是谷歌浏览器抓包对该网站数据进行分析,结果如下: 该网站地址:http://www.budejie.com/text 该网站数据都是通过html页面进行展示,网站url默认为第一页,http://www.budejie.com/text/2为第二页,以此类推 对网站的内容段子所处位置进行分析,
阅读全文
posted @ 2019-06-30 16:45 springionic
阅读(403)
评论(0)
推荐(0)
公告