会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
武林旧人
博客园
首页
新随笔
联系
管理
订阅
2018年11月19日
介绍一个java爬虫项目--webmagic
摘要: 记得很多年前,自已用HttpClient抓取了淘宝网的数据。写得比较累,对网页特整的分析要花很多时间,基本就是在一堆HTML代码里找特殊字符串,然后慢慢调试。 后来用到Jsoup,这就不用自已写HttpCilent了,最方便的是Jsoup有强大的选择器功能,定位页面元素就省力多了,但一番分析在所难免
阅读全文
posted @ 2018-11-19 11:06 武林旧人
阅读(390)
评论(0)
推荐(0)
公告