随笔分类 -  Spider蜘蛛爬虫

数据抓取
摘要:1:分析网页 市场信息-最新楼盘 http://www.sjzfgj.gov.cn/plus/scxx_zxlp.php 分住宅和非住宅两个分类 参数: pageno 页数 type 楼盘分类 1表示住宅,2表示非住宅 住宅uri: http://www.sjzfgj.gov.cn/plus/scx 阅读全文
posted @ 2016-11-10 19:49 wEndu 阅读(491) 评论(0) 推荐(0)
Cannot instantiate the type HttpClient问题(转)
摘要:看自己动手写爬虫,没想到一上来就跪了。 里面提到用的jar包是apache的http客户端开源项目 HttpClient 就去官网下载了一个版本4.3 当按书上代码敲时 HttpClient httpclient = new HttpClient(); 敲完这句,就给跪了 提示Cannot inst 阅读全文
posted @ 2016-10-12 21:19 wEndu 阅读(1396) 评论(0) 推荐(0)